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A+ «Data Structures and Algorithm Analysis in C} 一 书 第 2 版 的 简体 中 译本 。 原 书 曾 
被 评 为 20 世 纪 顶 尖 的 30 部 计算 机 著作 之 一 ， 作 者 Mark Allen Weiss 在 数据 结构 和 算法 分 析 方 面 
卓 有 建 树 ， 他 的 数据 结构 和 算法 分 析 的 著作 尤其 畅销 ， 并 受到 广泛 好 评 ， 已 被 世界 500 余 所 大 
学 用 作 教 材 。 

在 本 书 中 ， 作 者 更 加 精炼 并 强化 了 他 对 算法 和 数据 结构 方面 创新 的 处 理 方 法 。 通 过 C 程 序 的 
实现 ， 着 重 阐述 了 抽象 数据 类 型 的 概念 ， 并 对 算法 的 效率 .性 能 和 运行 时 间 进 行 了 分 析 ， 

全 书 特 点 如 下 ; 

e 专用 一 章 来 讨论 算法 设计 技巧 ， 包 括 贪 楚 算 法 、 分 治 算法 .动态 规划 、 随 机 化 算法 以 及 回 济 算 法 

e 介绍 了 当前 流行 的 论题 和 新 的 数据 结构 ， 如 斐 波 那 契 肉 ， 糙 堆 ， 二 项 队列 ， 跳 跃 表 和 伸展 树 

e 安排 一 章 专 门 讨 论 摊 还 分 析 ， 考 查 书 中 介绍 的 一 些 高 级 数据 结构 

e 新 开辟 一 章 讨论 高 级 数据 结构 以 及 它们 的 实现 , 其 中 包括 红 黑 树 , 自 顶 向 下 伸展 树 . treapp. k-d 


树 、 配 对 堆 以 及 其 他 相关 内 容 
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本 书 是 国外 数据 结构 与 算法 分 析 方 面 的 标准 教材 ,介绍 了 数据 结构 (大 量 数据 的 组 织 方 法 ) 
以 及 算法 分 析 {( 算 法 运行 时 间 的 属 算 }。 本 书 的 编 瑟 日 标 是 同时 讲授 好 的 程序 设计 和 算法 分 析 
靶 巧 ,使 读者 可 以 开发 出 具有 景 高 效率 的 程序 。 

本 书 可 作为 高 级 数据 结构 课程 或 研究 生 一 年 级 算法 分 析 课 程 的 教材 ,使 用 本 书 逢 具有 -- 些 
中 级 程序 设计 知识 ,还 需要 离散 数学 的 一 些 背 景 知 识 。 


Authorized translation from the English language edition entitled Data Structures and Algorithm 
Analysis in C, Second Edition by Mark Allen Weiss, ( ISBN0-201-49840-5) published by Pearson Edu- 
cation , Inc, publishing as Addison Wesley Longman, Copyright © 1997 by Addison Wesley Longman, 
Inc. 

All rights reserved. No part of this book may be reproduced or transmitted in any form or by any 
means, electronic or mechanic, including photocopying, recording, or by any information storage re- 
trieval system, without permission of Pearson Education, Inc. 

Chinese simplified language edition published by China Machine Press. 

Copyright (€ 2003 by China Machine Press. 


本 书 中 文 简体 学 版 由 美国 Pearson Education 培 生 教育 出 版 集团 授权 机 械 工 业 出 版 社 独 家 出 
版 。 未 经 出 版 者 书面 许可 ,不 得 以 任何 方式 复制 或 抄袭 本 书 内 容 。 
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由 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 这 步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 区 出 、 独 领 风 暗 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 械 来 越 紧 密 地 结合， 计算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 各 教学 的 最 前 线 ， 由 此 而 产 牛 的 经 鉴 科 学 著作 ， 不 仅 澡 
划 了 妈 究 的 范畴 ， 还 揭 药 了 学 本 的 源 变 ， 醋 遵循 学 术 规 范 ， 又 月 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 . 

近年 ， 在 全 球 依 息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 日 
蜗 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建 没 在 教育 战略 
上 显得 举足轻重 ， 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 同 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接 罗 、 建 
没 真正 的 志 界 一 流 大 学 的 必由之路 - 

机 械 工业 出 版 社 华章 图 文 信息 有 限 公 司 较 时 意识 到 “上 出 版 要 为 教育 服务 "。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 进 选 、 称 译 国 让 优秀 教材 上 。 经 过 几 年 的 不 懈 和 努力 ， 我 们 与 
Prentice Hall, Addison-Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著 包 出 版 公司 建立 了 
良好 的 合作 关系 ， 从 它们 现 有 的 数 百 种 教材 中 王选 出 Tanenbaum，Stroustrup，Kernighan， 
Jim Gray 等 大 师 名 家 的 … 批 经 典 作品 ， 以 “计算 机 科学 丛书” 为 总 称 出 版 ， 供 谈 者 学 习 、 研 
RMR. KHOR, REARS REAR, 

“TPA SLESEAH” HOR PEST BASES ROS BD, BAM SRA Dj 
肯 的 选 题 指导 ,还 不 辞 劳苦 也 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专 诚 为 其 书 的 中 译本 作 序 . 僻 今 ,“ 计 算 机 科学 其 书 ” 已 经 出 版 了 近 百 个 
品种 ， 这 些 书籍 在 污 者 中 树立 了 良好 的 口 看 ， 并 被 许多 沪 校 采用 为 正式 教材 和 参考 书籍 ,为 
进 - 步 推广 与 发 展 打 下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 入 一 个 新 的 阶段 。 为 此 ， 华 章 公 司 将 加 大 引进 教材 的 力度 ， 在 “华章 教育 ”的 总 规划 
之 下 出 版 三 个 系列 的 计算 机 教材 ， 除 “计算 机 科学 丛书 ”之 外 ， 对 影印 版 的 教材 ， 则 单独 开 
辟 出 “ 既 典 原版 书库 ”:， 同 时， 引进 全 美 通行 的 教学 辅导 书 “Schaum's Outlines” 系 列 组 成 
“全 美 姑 典 学 习 指导 系列 "， 为 了 保证 这 二 套 丛 书 的 权威 性 ， 同 时 也 为 了 更 好 地 为 学 校 和 老师 
们 服务 ， 华 章 公司 聘请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 复 旦 大 和 学 、 上 上 
海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科 技 大学、 哈尔滨 工业 大 学 、 西 安 交 通 太 学 、 中 国 
人 民 大 淮北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 山 太 学 、 解 放 军 理工 大 学 、 郑 州 大 学 、 漳 
AE LE BE. 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 领域 
的 等 名 学 者 组 成 “专家 指导 委员 会 "， 为 我 们 提供 选 题 意见 利 出 版 上 监督。 

这 三 人参 内 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 


的 教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. 工 工 ，Stanford，U.C. Berkeley, C. M. U. itt? 
名 上牌 太 党 所 采用 不仅 亩 盖 了 程序 设计 、 数 据 结构 、 操 作 和 系统、 计算 机 体系 结构 、 数 据 库 、 
编译 原理 、 软 件 工程 、 图 形 学 、 通 优 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普通 寺 届 的 核 
心 课 程 ， 而 且 各 有 具 特色 一 一 有 的 出 自 语 言 设 计 者 之 手 、 有 的 历经 三 十 年 而 不 二 、 有 的 局 被 全 
世界 的 几 百 所 高 校 采用 .在 这 些 圆 熟 通 捕 的 名 师 太 作 的 指引 之 下 ， 读 者 必 将 在 订 算 机 科学 的 
宫殿 中 由 登 党 而 人 室 . 

权威 的 作者 ， 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 精细 的 编辑 ,这些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 
的 重要 帮助 。 教 材 的 出 版 只是 我 们 的 后 续 服务 的 起 点 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 子 指正 ， 我 们 的 联系 方法 如 下 ， 


Fa TARH: hzedu@hzbook.com 

联系 电话 : (010 ) 68995264 

联系 地 址 : dio m PREX ES FERE EU 
邮政 编码 : 100037 
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随 着 速度 的 不 断 提 高 和 存储 容量 的 持续 增长 ,计算 机 的 功能 日 益 强大 ,从 而 处 理 数 据 和 解 
决 问题 的 规模 和 复杂 程度 与 日 惧 增 。 这 不 仅 带 来 了 需要 认真 研究 的 新 课题 ,而 且 突 出 了 原 有 
数据 结构 和 算法 效率 低下 的 缺点 。 程 序 的 效率 问题 不 是 由 于 计算 机 功能 的 强大 而 受到 冷落 ， 
相反 地 ,倒是 被 人 们 提 到 前 所 未 有 的 重视 程度 ,因为 大 型 问题 的 解决 所 涉及 到 的 大 容量 存储 和 
高 速度 运 等 容 不 得 我 们 对 效率 有 丝毫 的 忽视 。 本 书 正 是 在 前 述 数据 结构 基本 概念 的 同时 深信 
地 分 析 了 算法 的 效率 。 书 中 详细 介绍 了 当前 流行 的 论题 和 新 的 变化 ,讨论 了 算法 设计 技巧 ,并 
在 研究 算法 的 性 能 ,效率 以 及 对 运行 时 间 分 析 的 基础 上 考查 了 一 些 高 级 数据 结构 ,从 历史 的 角 
度 和 近年 的 进展 对 数据 结构 的 活 唉 领域 进行 了 简要 的 概括 。 由 于 本 书 选 材 新 完 , 方 法 实用 , 题 
HFS ,取舍 得 当 , 因 此 ,自从 出 版 以 来 受到 广泛 欢迎 ,已 被 计 界 许多 知名 大 学 用 作 教 材 。 

本 书 的 目的 是 培养 学 生 良 好 的 程序 设计 技巧 和 熟练 的 算法 分 析 能 力 ,使 得 他 们 能 够 开发 
出 高 效率 的 程序 。 从 服务 于 实践 又 锻炼 学 生 实 际 能 力 出 发 , 书 中 提供 了 大 部 分 算法 的 CC 程序 
和 和 伪 码 例 程 ,但 并 不 是 全 部 。 一 些 程序 可 从 互联 网 上 获得 。 

承蒙 卢 开 梁 教授 、 陈 贤 经 先生 、 温 丽 芳 女士 的 鼓励 , 译 者 有 幸 将 国外 几 部 优秀 原著 介绍 给 
我 国 的 读者 ; 鞠 神 先生 认真 的 工作 使 本 书 译文 免除 不 少 玖 漏 和 错误 ; 杨 海 玲 女 士 的 监督 使 翻译 
工作 比 预 想 的 顺利 。 译 者 在 此 表示 衷心 的 感谢 。 译 者 还 愿意 借 此 机 会 感谢 挚友 孙 华 先生 ,他 
对 本 书 的 翻译 王 作 自始至终 给 予 热心 的 关怀 和 无 私 的 帮助 。 

由 于 时 间 及 水 平 所 限 , 书 中 译文 不 当 之 处 , 统 析 学 术 界 同仁 及 广大 读者 网 正 。 


译 者 
2003 年 9 月 
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本 书 讨论 数据 结 宰 和 芷 法 分 析 。 数 据 结构 主要 研究 组 织 大 量 数 据 的 方法 ,而 算法 分 析 则 
是 对 算法 运行 时 间 的 评估 。 随 着 计算 机 的 速度 越 来 越 快 ,对 于 能 够 处 理 大 量 输 和 人 数据 的 程序 
的 需求 变 得 日 益 急 女 。 可 是 ,由 于 在 输入 量 很 大 的 时 候 ,程序 的 低 效率 现象 变 得 非常 明显 , 因 
此 这 又 要 求 对 效率 问题 给 予 更 仔细 的 关注 。 通 过 在 实际 编程 之 前 对 算法 的 分 析 , 学 生 可 以 决 
定 一 个 特定 的 解法 是 否 可 行 。 例 如 ,学 生 在 本 书 中 将 读 到 一 些 特定 的 问题 并 看 到 精心 的 实现 
方法 是 如 何 把 对 大 基数 据 的 时 间 限 制 从 16 年 减 至 不 到 1 秒 的 。 因 此 ,者 无 运行 时 间 的 阐释“， 
就 不 会 有 算法 和 数据 结构 的 所 出。 在 其 些 情况 下 , 对 于 影响 算法 实现 的 运行 时 间 的 一 些微 小 
绍 节 都 需要 认真 地 探究 。 

一 旦 解法 被 确定 ,程序 还 是 必须 要 编写 的 。 随 着 计算 机 的 日 益 强 大 ,它们 必须 解决 的 问题 
就 变 得 更 加 巨大 和 复杂 ,这 就 要 求 开 发 更 加 复杂 的 程序 。 本 书 的 目的 是 同时 教授 学 生 良 好 的 
程序 设计 技巧 和 算法 分 析 能 力 ,使 得 他 们 能 够 开发 这 样 的 具有 最 高 效率 的 程序 。 

本 书 适合 作为 高 级 数据 结构 (CS7) 课 程 或 是 研究 生 第 一 年 算法 分 析 课 程 的 教材 。 学 生 应 
该 具有 中 等 程度 的 程序 设计 知识 ,包括 像 指 针 和 递归 这 样 一 些 内 容 , 还 要 具有 离散 数学 的 基 些 
知识 。 
方法 

我 相信 ,对 于 学 生 重要 的 是 学 习 如 何 自己 动手 编写 程序 ,而 不 是 从 书 上 上 找 贝 程序 。 但 为 一 
方面 ,讨论 现实 程序 设计 问题 而 不 套用 样本 程序 实际 上 其 不 可 能 的 。 由 于 这 个 原因 ,本 书 通常 
提供 实现 方法 的 大 约 一 半 到 四 分 之 三 的 内 容 并 鼓动 学 生 补足 其 余 的 部 分 。 第 12 章 是 这 一 版 
新 加 的 一 章 ,讨论 主要 仙 重 于 实现 细节 的 一 些 附 加 的 数据 结构 。 

本 书 中 的 算法 均 以 ANS] C 表示 ,尽管 有 些 欠 缺 ,但 它 仍 然 是 最 流行 的 系统 程序 设计 语 
F. CË Pascal 的 使 用 使 得 动态 分 配 数 组 成 为 可 能 (可 见 第 5 章 中 的 "再 散 列 ")。 它 还 在 儿 
人 处 地 方 将 代码 简化 ,这 通常 是 因为 与 (多久) 操作 走 捷径 的 缘故。 

对 CC 的 大 多 数 批评 集中 在 用 它 写 出 的 程序 代码 可 读 性 差 的 事实 上 。 仅 仅 少 击 几 次 键 ,者 
牺牲 了 程序 清晰 性 ,而 程序 的 速度 又 没有 增加 。 因 此 ,诸如 同时 贡 值 以 及 通过 

ifix= y) 
测试 是 否 为 0 等 技巧 一 般 不 在 本 书 中 使 用 。 相 信 本 书 将 证 明 只 要 细心 练习 是 可 以 避免 那些 难 
以 读 懂 的 代码 的 。 


内 容 提要 
第 1 章 包 含 离散 数学 和 递归 的 一 些 复习 材料 。 我 相信 对 递归 做 到 泰然 处 之 的 惟一 办 范 是 


Yi 


反复 不 断 地 看 一 些 好 的 用 法 。 因 此 , 除 第 5 章 外 ,递归 般 及 本 书 每 一 章 的 例子 之 中 。 

第 2 童 处 理 算法 分 析 . 这 一 音效 述 洛 进 分 析 和 人 它 的 主要 弱点 。 这 里 提供 了 许多 例子 ,也 
括 对 对 数 运行 时 间 的 深 和 人 解释。 通过 直观 地 把 一 些 简 单 递归 程序 转变 成 迭代 程序 而 对 它们 进 
行 分 析 。 介 绍 了 更 为 复杂 的 分 治 程序 ,不 过 有 些 分 析 ( 求 解 递归 关系 } 要 推迟 到 第 7 意 再 详细 
讨论 。 

第 3 章 包括 表 . 栈 和 队列 。 重 点 放 在 使 用 ADT 对 这 些 数 据 结 构 编程 ,这 些 数据 结构 的 快 
速 实 现 ,以 及 介绍 它们 的 某 些 用 途上 。 课文 中 玫 乎 没有 什么 程序 (只 有 些 例 程 ) ,而 程序 设计 作 
业 的 许 客 思想 基本 上 体现 在 练习 之 中 。 

第 4 章 讨 论 树 , 重 点 在 查找 树 ,包括 外 部 查找 树 (B 树 }。UNIX 文件 系统 和 表达 式 树 是 作 
为 例子 来 介绍 的 。AVL 树 和 伸展 树 只 作 了 介绍 而 没有 人 分析。 程序 写 出 7596 ,其 余部 分 留 给 
学 生 完成 。 查 我 树 的 实现 细节 见 第 12 章 。 树 的 另外 一 些 内 雁 , 如 文件 压缩 和 博 主 树 , 延 返 到 
第 10 章 讨 论 。 外 部 媒体 上 的 数据 结构 作为 几 章 中 的 最 后 论题 来 讨论 。 

第 5 章 是 相对 较 旺 的 一 章 .主要 讨论 散 列 表 。 这 里 进行 了 某 些 分 析 ,本 章 末 尾 讨论 了 可 扩 
散 列 。 

第 6 章 是 关于 优先 队列 的 。 二 义 堆 也 在 这 里 讲授 , 述 有 些 附 加 的 材料 论述 优先 队列 某 些 
理论 上 有 趣 的 实现 方法 。 裴 波 那 契 堆 在 第 11 章 讨论 ,配对 堆 在 第 12 章 讨论 。 

第 7 章 讨论 排序 。 它 特别 关注 编程 细节 和 分 析 。 讨 论 并 比较 所 有 通用 的 排序 算法 。 对 以 
下 四 种 算法 详细 地 进行 了 分 析 : 插 和 人 排序 、 希 尔 排 序 、 堆 排序 以 及 快速 排序 。 堆 排序 平均 情形 
运行 时 间 的 分 析 对 子 这 一 版 来 说 是 新 的 内 容 。 本 章 末 尾 讨 论 了 外 部 排序 。 

第 8 章 讨 论 不 相交 集 算法 并 证 明 其 运行 时 间 。 这 是 短 且 特殊 的 一 章 ,如 果 不 洁 论 Kruskal 
算法 则 该 章 可 跳 过 。 

第 9 章 讲授 图 论 算法 。 图 论 算法 的 重要 人 性 不 仅 因为 它们 在 实践 中 经 常用 到 ,而 且 还 因为 
它们 的 运行 时 间 强 烈 地 依赖 于 数据 结构 的 怡 当 使 用 。 实 际 上 ,所 有 标准 算法 都 是 和 相应 的 数 
据 结构 . 板 代 码 以 及 运行 时 间 的 分 析 一 起 介绍 的 。 为 把 这 些 问 题 放 进 一 本 适当 的 教材 中 ,我 们 
对 复杂 性 理论 {包括 NP- 完 全 性 和 不 可 判定 性 ) 进 行 了 简短 的 讨论 。 

第 10 章 通 过 考查 一 般 的 问题 求解 技巧 讨论 算法 设计 。 这 一 章 添 加 了 了 大量 的 实例 。 这 里 
及 后 面 各 意 使 用 的 伪 代 码 使 得 学 生 更 好 地 理解 例子 ,而 避免 被 实现 的 细节 所 困扰 。 

第 11 音 处 理 挫 还 分 析 。 对 来 自 第 4 章 到 第 6 章 的 三 种 数据 结构 以 及 本 章 介绍 的 莫 波 那 
契 堆 进行 了 分 析 。 

第 12 章 是 这 一 版 新 加 的 一 章 ,讨论 查找 树 算法 、k-d 树 和 配对 堆 。 不 同 于 其 他 各 章 , 本 音 
给 出 了 查找 树 和 配对 堆 完 全 的 仔细 的 实现 。 材 料 的 安排 使 得 教师 可 以 把 一 些 内 容纳 入 到 其 他 
各 音 的 讨论 之 中 。 例 如 ,第 12 章 中 的 自 项 向 下 红 黑 树 可 以 在 (第 4 章 的 )AVL 树 下 讨论 。 

第 1 意 到 第 9 章 为 大 多 数 的 一 学 期 数据 结构 课程 提供 了 足够 的 材料 。 如 果 时 间 人 允许 , 那 
么 第 10 章 也 可 以 包括 进来 。 研 究 生 的 算法 分 析 课程 可 以 使 用 第 7 章 到 第 11 章 的 内 容 。 第 
11 音 所 分 析 的 高 级 数据 结构 可 以 容易 地 在 前 面 各 章 中 查 到 。 第 9 章 中 对 NP- 完 全 性 的 讨论 
对 于 这 门 课 来 说 太 过 简要 ,Garey 和 Johnson 的 论 NP- 完 全 性 的 书 ( 有 张 立 昂 等 翻译 的 中 文 译 
本 :计算 机 和 难 解 性 ,科学 出 版 社 ,1987 一 一 译 者 注 ) 可 以 补充 本 书 的 不 是 。 





练习 


在 每 章 末 尾 提 供 的 练习 与 书 中 讲授 的 内 容 顺 序 相 匹配 。 最 后 的 一 些 练习 是 针对 整个 一 章 
而 不 是 特定 的 某 一 节 。 难 做 的 练习 标 以 一 个 星 呈 ,更 难 的 练习 标 有 两 个 星 号 。 
教师 可 从 Addison-Wesley 出 版 公司 得 到 包含 几乎 所 有 练习 管 案 的 解 题 指南 。 


参考 文献 


参考 文献 位 于 每 章 的 最 后 。 一 般 说 来 ,这 些 参考 文献 或 者 是 历史 性 的 ,代表 着 书 中 材料 的 
原 她 来 源 , 或 者 闭 述 对 书 中 给 出 的 结果 的 扩展 和 改进 。 有 些 文 献 论述 了 一 些 练习 的 解法 。 


代码 的 获得 


本 书 中 的 程序 代码 通过 匿名 fp 可 在 aw. com 网 站 得 到 。 这 个 网 站 也 可 以 道 过 World 
Wide Web 来 访问 ;其 URL 为 http: “Awww. aw. com/cseng/( Mb ab Sk Be pe HE). ESL YE 
确 位 置 可 能 变化 。 
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第 1 章 5l 论 


在 这 一 章 , 我 们 阐述 本 书 的 目的 和 旧 标 并 简要 复习 离散 数学 以 及 程序 设计 的 一 些 概 念 。 
我 们 将 要 ， 
”看 到 程序 在 较 大 输入 情况 下 的 运行 性 能 与 在 适量 输入 情况 下 的 运行 性 能 具有 同等 重 
ATE. 
+ 总 结 本 书 其 余部 分 所 需要 的 基本 的 数学 基础 。 
简要 复习 递归 。 


1.1 本 书 讨 论 的 内 容 


设 有 一 组 N 个 数 而 要 确定 其 中 第 ORAS. 我 们 称 之 为 选择 问题 (selection problem). 
大 多 数学 习 过 一 两 门 程序 设计 课程 的 学 生 写 一 个 解决 这 种 间 题 的 程序 不 会 有 什么 困难 。“ 显 
而 复 见 的 ” 解 快 方法 有 很 多 。 

该 问题 的 一 种 解法 就 是 将 这 N 个 数 读 进 一 个 数组 中 , 再 通过 某 种 简单 的 算法 ,比如 时 泡 
排序 法 ， 以 递减 硕 序 将 数组 排序 ,然后 返回 位 置 上 上 的 元 察 。 

稍微 好 一 点 的 算法 可 以 先 把 前 个 元 素 读 入 数组 并 (以 递减 的 顾 序 ) 对 其 排序 。 接 着 , 将 
剩 下 的 元 素 再 逐个 读 入 。 当 新 元 宗 被 读 到 时 , MRE DFRAPIS TCU ELE, 否则 
就 将 其 放 到 数组 中 正确 的 位 置 上 , 同时 将 数组 中 的 一 个 元 染 挤 出 数组 。 当 算法 终止 时 , 位 于 
第 六 个 位 置 上 的 元 宗 作 为 答案 返回 。 

这 两 种 算法 编码 都 很 简单 ,建议 读者 试 一 试 。 此 时 我 们 自然 要 问 :哪个 算法 更 好 ? RR 
He? 还 是 两 个 算法 都 足够 好 ? 使 用 含有 一 百 万 个 元 素 的 随机 文件 , ŒE k= 500 000 的 条 
件 下 进行 模拟 发 现 , 两 个 算法 在 合理 的 时 间 量 内 均 不 能 结束 ; 每 种 算法 都 需要 计算 机 处 理 若 
干 天 才能 算 完 (虽然 最 后 还 是 给 出 了 正确 的 答案 )。 在 第 7 章 将 讨论 另 一 种 算法 ,该 算法 将 在 
一 秒 钟 左右 给 出 问题 的 解 . 因此 ， 虽 然 我 们 提出 的 两 个 算法 都 能 算出 结果 , 但 是 它们 不 能 被 
认为 是 好 的 算法 ,因为 对 于 第 三 种 算法 在 合理 的 时 间 内 人 能够 丸 理 的 输入 数据 量 而 言 ， 这 两 种 
算法 是 完全 不 切实 陈 的 。 

第 二 个 问题 是 解决 一 个 流行 的 字谜 。 输入 是 由 一 些 字母 和 单 
词 的 二 维 数组 组 成 。 目 标 是 要 找 出 字谜 中 的 单词 ,这些 单词 可 能 
是 水 平 、 垂 直 或 沿 对 角 线 以 任何 方向 放置 的 。 作为 例子 , 图 1-1 
所 示 的 字谜 由 单词 this, two. fat 和 that 组 成 。 单词 this 从 第 一 
行 第 一 列 的 位 置 即 (1, 1) 处 开始 并 延伸 至 (1, 4); 单词 two MCI, 
1) 到 (3, 1); fat 从 (4,，1) 到 (2,3); m that MAC, HEGI, 1). 

现在 至 少 有 两 种 直观 的 算法 来 求解 这 个 问题 。 对 单词 表 中 的 每 个 单词 ,我们 检查 每 一 个 
有 序 三 元 组 ( 行 , 90, 方向 ), 验证 是 否 有 单词 存在 。 这 需要 大 量 檬 套 的 for BY, 但 它 基 本 上 
是 直观 的 算法 ， 

也 可 以 这 样 ,对 于 每 一 个 尚未 进行 到 字谜 最 后 的 有 序 四 元 组 ( 行 , 列 , 方向 , 字符 数 ) 我 
们 可 以 测试 所 指 的 单词 是 否 在 单词 表 中 。 这 也 导致 使 用 大 量 项 套 的 for 循 环 。 如 果 在 任意 单 





图 1-1 字迹 示例 


[2] 


FE 


闻 中 的 最 大 字符 数 已 知 , 那么 该 算法 有 可 能 节省 一 些 时 间 。 

上 述 两 种 方法 相对 来 说 都 不 难 编码 并 可 求解 通 沉 发 表 于 杂志 上 的 许多 现实 的 字迹 游戏 。 
这 些 字谜 通常 有 16 行 16 列 以 及 40 个 左右 的 单词 。 然 而 ,假设 我 们 把 字谜 变 成 为 只 给 出 谜 板 
(puzzle board) 而 单词 琢 基 本 上 是 一 本 英语 词典 ， 则 上 面 提 出 的 两 种 解法 需要 相当 可 观 的 时 间 
来 解决 这 个 问题 , 故 这 丙种 方法 都 是 不 可 接受 的 。 不 过 , 这 样 的 问题 还 是 有 可 能 在 数秒 内 解 
HAJ, 即使 单词 表 很 大 也 可 以 。 

在 许多 问题 当中 , 一 个 重要 的 观念 是 : 写 出 一 个 可 以 工作 的 程序 并 不 够 。 如 条 这 个 程序 
在 巨大 的 数据 集 上 运行 , 那么 运行 时 间 就 变 成 了 重要 的 问题 。 我 们 将 在 本 书 中 看 到 对 于 大 量 
的 输入 ,如 何 估计 程序 的 运行 时 间 , 尤其 是 如 何在 尚未 具体 编码 的 情况 下 比较 两 个 程序 的 运 
行 时 间 。 我 们 还 将 看 到 御 底 改进 程序 速度 以 及 确定 程序 瓶颈 的 方法 。 这 些 方法 将 使 我 们 能 够 
找到 需要 大 为 优化 的 那些 代码 段 。 


1.2 数学 知识 复习 


这 一 节 列 出 一 些 需要 记 住 或 是 能 够 推导 出 的 基本 公式 , 复习 基本 的 证 明 方 法 。 
1.2.1 指数 
AXE — yars 
x = X^ -B 
(X^ y? — As 
XN + XN -2XP v XY 
2N ,2N -2N*! 
1.2.2 对 数 
在 计算 机 科学 中 , 除非 有 特别 的 声明 ,所 有 的 对 数 都 是 以 2 为 底 的 。 
EM: X =B, SAMS logyB=A 
由 该 定义 可 以 得 到 几 个 方便 的 等 式 。 
定理 1.1 


_ logcB 
logaB -goA ' C»0 


证 阴 : 
4 X -logcB, Y —-logoA, UR Z=logaB。 此 时 由 对 数 的 定义 得 :CXY=B8, C SAMAR 
AZz= B, 联合 这 三 个 等 式 则 产生 (CY')*= CY = B. AM, X= YZ, 这 意味 着 Z-X/Y, 
定理 得 证 。 
定理 1.2 

logAB = logA + logB 
ur AA: 
A> X -log A, Y=log B, UR Z=logAB. 此 时 由 于 假设 默认 的 底 为 2, 2*-A,2' - B 
及 2!- AB, 联合 最 后 的 三 个 等 式 则 有 212! 22^ = AB. 因此 X+ Y 77, 这 就 证 明了 该 
定理 。 
其 他 一 些 有 用 的 公式 如 下 , 它们 都 能 够 用 类 似 的 方法 推导 。 


f rÉ 3 


log A /B =logA - logB 

logf AP) = H log A 

logX < XX( 对 也有 的 X 20 IE.) 

log 1=0, log 2=1, log | 024—10, log t 048 576-20, 
1.2.8 RB 

最 容易 记忆 的 公式 跨 


NI - 2l —] 


在 第 二 个 公式 中 , AR OA, M 
Sac 


"EN 趋 于 om 时 该 和 趋向 于 L/UL- A), 这 些 公式 是 “几何 级 数 " 公式 ， 
我 们 可 以 用 下 面 的 方法 推导 关于 Y AO < A< D 的 公式 . OS 表示 和 .此 时 
S-]1]4 A A* 4 A? - A* e Ao e 
TH 
AS = Ac A? AŻ Att A been 
———— — 等 号 右边 所 有 的 项 相 消 ,只 贸 
F1: 
S-AS = 1 
这 就 是 说 
1 
571-A 
可 以 用 相同 的 方法 计算 57 225. CE TARBI. 我 们 与 成 


~1,2,3, 4,35. 
5 2 +52 3*5" 95 ^ 


"arem 


用 2 3&2 CEU 
_ 2,3,485,5.,95,... 
25 = 1+5 +53 tataa tast 
将 这 两 个 方程 相 减 得 到 
t L,l,l,1,... 
a i i ir a ae 
因此 ,5 =2; 


分 析 中 另 一 种 常用 类 型 的 级 数 是 算术 级 数 。 任 何 这 样 的 级 数 都 可 以 通过 基本 公式 计算 其 值 、 


sv, = NAD LD N? 
7 2 2 


例如 ， 为 求 出 和 2+5+81 - C+ (38-1), 将 其 改写 为 3{1+2431.… +e) -CL+1+1 
perd), GOR, 它 就 是 GR(R e D/2— k, 另 一 种 记忆 的 方法 则 是 将 第 - -项 与 最 后 一 项 相册 





CRUS 3b +1), BOIS RS I AE 3k 0, 等 等 。 MFE 72 个 这 样 的 数 对 ， 
ARE 2(32+1)/2, 这 与 前 面 的 答案 相同 。 

现在 介绍 下 面 丙 个 公式 , 它们 就 没有 那么 常见 了 。 
Y Az MN EDON ED NP 
全 3 


1 





Y k+l 
È e N — 
2 i feta, 67-1 


当下 = 一 1 时, 后 一 个 的 公式 不 成 立 。 此 时 我 们 需要 下 面 的 公式 , 这 个 公式 在 计算 机 科学 
中 的 使 用 要 远 比 在 数学 其 他 科目 中 使 用 得 多 。 数 Ay 叫做 调和 数 , 其 和 叫做 调和 和 ,下面 近 
isk ARB y=0.57721566, 这 个 情 称 为 欧 拉 常数 (Euler s constant) e 


Ay = 5, + e loge N 
以 下 两 个 公式 只 不 过 是 一 般 的 代数 运算 . 
2; f(N) = NECN) 


$3 fG) = 2; faa) - 2; f) 

1.2.4 模 运算 

如 果 N 整除 A 一 B. 那么 我 们 就 说 A 与 B8 模 NN 同 余 (oongruenm), i079 A=B(mod N}. E 
WHS, 这 意味 着 无 论 A 还 是 BERNER, 所 得 余数 都 是 相同 的 。 于 是 , 816151 (med 10). 
如 同等 号 的 情形 一 样 , d: A 三 Blmod N), WI A+ C=B+ Cmd N) 以 及 AD-—RD(mod NJ. 

有 许多 的 定理 适用 模 运 算 , 其 中 有 一 些 特别 要 用 到 数论 来 证 明 。 我 们 将 谨慎 地 使 用 模 适 
算 , 这 样 ,前 面 的 一 些 定理 也 就 足够 了. 
1.2.5 证 明 方 法 

证 明 数 据 结构 分 析 中 的 结论 的 两 个 最 常用 的 方法 是 归纳 法 和 反 证 法 (偶尔 也 被 连用 到 只 
有 教授 们 才 使 用 的 证 明 方 法 )。 让 明 一 个 定理 不 或 开 的 最 好 的 方法 是 举 出 一 个 反例 
归纳 法 证 朋 

出 归纳 法 进行 的 证 明 有 两 个 标准 的 部 分 。 第 一 步 是 证 明基 准 情形 (base case) , 就 是 确定 
定理 对 于 革 个 { 某 些 )? 小 的 (通常 是 退化 的 ) 值 的 正确 注 : 这 一 步 玫 乎 总 是 很 简单 的 。 接着, 进 
行 归 纳 假 设 (inductive hypothesis)。 一 般 说 来 ， 这 意味 着 假设 定理 对 直到 某 个 有 限 数 * 的 所 有 
的 情况 都 是 成 立 的 。 然后 使 用 这 个 假设 证 明定 理 对 下 一 个 什 ( 通 常 是 + 1) 世 是 成 立 的 。 至 此 
定理 得 证 (在 点 是 有 限 的 情形 下 ) 

作为 一 个 例子 , 我 们 证 明 斐 波 那 契 数 ，Fo= d, Fio l1, F2=2, Facts Fy=5, ,.., 
F =F, +F, 2, ILE F< (53). CAE BLE Fo=0， 这 只 不 过 将 该 级 数 做 了 
一 次 平移 ) 为 了 证 明 这 个 不 等 去， 我 们 首先 验证 定理 对 平 几 的 情形 成 立 。 容易 验证 FS s 
5/3 K F,-22«25/9, 这 就 证 明了 基准 情形 。 假设 定理 对 于 i51, 2 k BOE. 这 就 是 归 
AR. 为 了 证 明定 理 , 我 们 须要 证 明 Fri LGBT 根据 定义 我 们 有 

F; = Fy t+ Pees 
将 归纳 假设 用 于 等 号 右边 , 我 们 得 到 


Fasc (SA) 03)» 
« (3/9)(5/3)4'1 + (375y (873)! 
« (375)(5/3)*'! + (9725) (5/3)! 
化 简 后 为 
Fad GA — 925) (573) F 1! 
< (24/25)(573) 7 
< (8/3)7 
xx EUH] pix ug. 
(C55 iin. ER HEAR P ee PE 
定理 1.3 


SU N21, yN p- MOLCDON D 
very SS 
1--] 


证 明 : 用 数学 归纳 法 让 切 , 对 于 基准 情形 , 容易 看 到 , 定理 当 N=1 的 叶 候 成 立 - 对 于 归 L6 
NER. 我 们 这 定理 对 URN 成立。 我 们 将 在 该 椒 设 下 证 果 定 理 对 于 NN ! 0 也 是 成 并 的 








我 们 有 有 
^1] ^ 
P= PHN GD) 
-1 L 
e FAY A fei 6 IITE 
Sis NUN LES 0D. (N11 
= (N+ p [8€ * 1) (N4 D), 
TIN T 
ONE D ZN 全 | 6 
N+D(N I DON 43) 
B 6 
因此 
Sp ON-DION 41 -1]20N 2 D 9 1j] 
m 
定理 得 让 
通过 反例 证 明 
公式 PELLI Bur. 证 明 这 个 结论 的 最 容易 的 方法 就 是 计算 Fy = 144» 11. 
上 反 证 法 证 阴 


厅 汪 法 证 明 是 通过 假设 定理 不 成 立 ， 然 后 证 明 该 假设 导 笃 革 个 已 知 的 必 质 不 成 立 , 从 而 
说 明 底 假设 是 错误 的 。 -个 经 典 的 例子 是 证 明 存在 无 穷 多 个 素数 。 为 了 证 明 这 个 结论 , RI 
假设 定理 不 成 六 。 于 是 ， 存 在 菜 个 最 大 的 过 数 IS. Pi Po o Pe 居 依 序 排列 的 所 有 类 
BEA KE 
N P\PoPyo Py +3 
显然。N 是 比 PP， 大 的 数 ,根据 假设 N REAR. TE. Pi Poor, 应 ARERR. BUS 
党 得 的 结果 总 有 余数 1。 这 就 产生 一 个 东 慎 ,网 为 每 “个 整数 或 者 是 素数 , 或 者 中 素数 的 乘 


= 


É o RF 


E. 内 此 , P, 是 最 大 素数 的 原 假设 是 不 成 六 的 , 这 正 意味 着 定理 成 ， 
1.3 Bait 


我 们 熟悉 的 大 多 数 数 学 函数 是 由 一 个 简单 公式 插 述 的 - 例如 , 我 们 可 以 利用 公式 
C= 5(F — 32) 9 
把 华氏 温度 转换 成 摄氏 温度 。 有 了 这 个 公式 , 写 一 个 C ARAARA ET 2 除去 程序 中 的 说 明 
和 太 括 号 外 , HAAR RT C RF. 

有 时 候 数 学 函数 以 不 太 标 准 的 形式 来 定义 。 作 为 -个 例子 , 我 们 可 以 在 非 负 整 数 集 上 征 
LAAR OF, EGUEPF(QOTOHF(OX)-22FOX — D 9 X2, 从 这 个 定义 我 们 看 到 F(1)=1.， 
F(2)=6, 下 (3)=21, 以 及 下 (4) 二 58。 当 一 个 函数 用 它 自己 来 定义 时 就 称 为 是 递归 (recur- 
sive) fj. C 允许 函数 是 递归 的 。 中 但 重要 的 是 要 记 住 , C 提供 的 仅仅 司 遵 循 递归 思想 的 一 种 企 
图 。 不 是 所 有 的 数学 递归 函数 都 能 有 效 地 {或 正确 地 ) 由 C 的 递 妇 黎 拟 来 实现 。 RELE E PITE 
说 的 是 递归 函数 上 应 该 只 用 几 行 就 能 表示 出 来 ,正如 非 递 归 苯 数 一 样 。 图 1-2 48 H3 T PRK F 
的 递归 实现 。 









int 
FC int X 3 





i 
f* 1*/ if( X == 0 J 


/* py return 0: 
else 
f* 3*/ return 2 * F( X- 1) X * Xi 
} 


图 1-2 — PE RK 


第 一行 和 第 二 行 处 理 基 准 情 况 (base case),， 即 此 时 函数 的 值 可 以 直接 算出 而 不 用 求助 递 
IH. “FCX)=2F(X-1) + X^" 车 没有 “F(0)=0” 这 个 条 件 在 数学 上 没有 意义 一 样 , C 
的 递 妇 函数 车 无 基 准 情况 , tii EUER XLI. SHATNER. 

关于 递归 , 有 几 个 重要 并 且 可 能 会 被 搞 混 的 地 方 。 一 个 常见 的 问题 是 : 它 是 否 就 是 循环 
3848 (circular logic)? AEE: BARN XTRA AMT ORES, 但 是 我 们 并 没有 
用 函数 本 身 定义 该 函数 的 一 个 特定 的 实例 。 换 名 话说 ,通过 使 用 上 (5) 来 得 到 下 (5) 的 值 才 是 
循环 的 。 通 过 使 用 F(4) 得 到 F(5) 的 值 不 是 循环 的 , 除非 F(4) 的 求 值 又 要 用 到 对 FS) 的 计 
E. 两 个 最 重要 的 问题 恺 怕 就 是 “如 何 ”和 “为 什么 ”的 问题 了 。 这 将 在 第 3 音 正 式 解 决 。 这 
里 , 我 们 将 给 出 -个 不 完全 的 描述 。 

实际 上 ,递归 调用 在 处 理 上 与 其 他 的 调用 没有 什么 不 同 。 如 果 以 参数 4 的 值 调 用 函数 下 ， 
那么 程序 的 第 三 行 要 求 计算 2F(3) + 4* 4。 这 样 , 就 要 执行 一 个 计算 F(3) 的 调用 , 而 这 又 导 
致 计算 2F(2)+3*3。 因 此 , 又 要 执行 另 一 个 计算 F(2) 的 调用 , 而 这 意味 着 必须 求 出 2F(1) 
12x2 的 值 。 为 此 , 通过 计算 2P(0) Lx 1 而 得 到 FC). 此 时 , F(0) 必 须 被 赋值 。 由 于 这 
DERE, 因此 我 们 事先 知道 FE(0)= 0。 从 而 RCH 的 计算 得 以 完成 , 其 结果 为 L 然后 ， 
FD. FOURRE Ffd4) 的 值 都 能 够 计算 出 来 。 跟踪 持 起 的 函数 调用 (这 些 调 用 已 经 开始 
但 是 正 等 待 着 递归 调用 来 完成 ) 以 及 它们 中 变量 的 记录 工作 都 是 由 计算 机 自动 完成 的 。 然而 ， 


己 ” 对 于 数 秆 计算 使 用 递 叶 通常 不 是 个 好 主意 。 我们 只 在 解释 基本 论点 时 这 么 做 。 
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重要 的 问题 在 于 ,递归 调用 将 反复 进行 直到 基准 情形 出 现 : 例如 ,计算 PC - DIE TE] 
用 F(…-2)、F{ -3) 等 等 ,由 于 这 将 不 可 能 出 现 基准 情形 ,因此 程序 也 就 不 可 能 算出 管 案 ; fBl 
尔 述 可 能 发 生 更 加 微妙 的 错误 ,我 们 将 其 展示 在 图 1-3 中 , 图 1-3 中 程序 的 这 种 错误 是 将 第 
三 行 上 的 Bad(1) 定 义 为 Badf1y。 显 然 , 实际 上 Bad MRE RE I! b, 这 个 定 交 给 不 出任 何 线 
索 . 因此 , 计算 机 将 会 反复 调用 Badt1) 以 期 解 出 它 的 值 , 最 后 , 计算 机 夭 记 系统 将 证 满 空间 ， 
程序 出 庙 。 一 般 说 来 ,我 们 会 鸯 该 畏 数 对 一 个 特殊 情形 无 效 ， 而 在 其 他 情形 下 是 正确 的 。 但 
此 处 这 各 说 则 不 止 懈 ,因为 Badf2) 调 用 Bad(1), 因此 , Bad(2) dz ARER Hi Bes 不 仅 如 此 ， 
Bad(3), Bad(4), #0 Baa(5) 都 要 调用 Bad(2)，Bad(2) 算 不 出 值 , 它们 的 值 也 就 不 能 求 出 。 事 
i, 除了 0 之 外 , 这 个 程序 对 仔 何 的 N 都 不 能 一 严 算 出 结果 。 对 于 递归 函数 ,不 存在 像 
“ 特 珠 情形” 这样 的 情况 。 
上 面 的 讨论 导致 递归 的 前 两 个 基本 法 则 : 







int 
Bad( unsigned int N ) 


i 
/* 1*/ FON == 0 
/* 2*f return 0; 
else 
/* atf return Rad( N / 3413 «N- 1; 
} 


图 1-3 无 次 止 违 归程 序 


1 .基准 情形 (base case). 你 必须 总 槛 有 其 些 基准 的 情形 , 它们 不 放 递 妆 就 能 求解 . 

2. i d iib making progres). 对 于 那些 需要 沸 妇 求解 的 情形 , 递归 调用 必须 总 能 够 户 
着 产生 基准 情形 的 方向 推进 。 

在 本 书 中 我 们 将 用 递 州 解决 一 些 问题 ， 作 为 韭 数 学 应 用 的 一 个 例子 ， 考虑 AAT 
词典 中 的 词 都 是 用 其 他 的 词 定 义 的 。 当 我 们 查 -个 单词 的 时 候 , RIT] ERRORI ELT HU TRUE, 
于 中 我们 不 得 不 再 查 出 现在 解释 中 的 一 些 词 ,而 对 这 些 词 解释 中 的 某 些 词 我 们 艾 不 理解 , BS 
此 我 们 还 要 继 弦 这 种 搜索 . 因为 闻 典 是 有 限 的 . 所 以 实际 上 ,要么 我 们 最 终 介 到 -处 ,出 日 此 
外 解释 中 所 有 的 单词 (从 而 理解 这 里 的 解释 ,并 按照 查找 的 路 径 回头 理 解 其 余 的 解释 ); RA 
我 们 发 现 这 些 解 释 形成 一 个 循环 , 无 法 明白 共 中 的 意思 , 或 者 在 解释 中 过 要 我 们 理解 的 某 个 
单词 不 在 这 本 词典 里 。 

我 们 理解 这 些 单词 的 递归 策略 如 下 :如 果 我 们 知道 一 个 单词 的 含 父 ， 邦 么 就 算 我 们 成 功 ; 
&W. 我们 就 在 词典 里 查找 这 个 单词 . 如 果 我 们 理解 对 该 词 解释 中 的 所 有 的 单词 , 那么 又 算 
我 们 成 功 ; 否则 , 递归 地 查找 一 些 我 们 不 认识 的 单词 来 “算出 对 该 单词 解释 的 售 父 ， 如果 词 
th ae FEI SEE GH. 那么 这 个 过 程 就 能 够 终止 ; 如 果 其 中 一 个 单词 没有 查 刘 或 是 拒 成 循环 征 
LFE), BE Z X Tod BEB ASE - 
打印 输出 数 

没 我 们 有 一 -个 正 整数 N 并 希望 把 它 打 印 出 来 。 我 们 的 例 程 的 省 字 为 PrintQut( N} 假设 
仅 有 的 现成 1/0 例 程 将 只 处 理 单个 数字 并 将 其 输出 到 终端 。 我 们 将 这 个 例 程 合 公 为 
PriniDigit; PIAH, "PriniDigi C4) " RETI HI -个 na" SEE dg. 

递归 对 该 问题 提供 -个 非常 简 沾 的 解 .为 打印 “76234”, RE 要 首先 打印 中 “7623”, 然 





8 B1I* 
后 再 打印 出 “4”, 第 二 步 用 语句 “PrintDig 让 (Ng 10)” 很 容易 完成 , 但 是 第 一 步 却 不 比 原 问 题 
简单 多 少 , 它 实际 二 是 同一 个 疝 题 ， 因此 我 们 可 以 用 语 杀 “Printout(NAI0) ”递归 地 解决 它 。 

这 告诉 我 们 如 和 何 去 解决 一 般 的 问题 , SRA BAS FRR AER. 由 于 
我 们 尚未 定义 一 个 基 淮 情况 , 因此 很 清楚 , RNAS SSR, WE OSLN I0, 那么 
我 们 的 基 淮 情形 就 是 “Printbigit(N})”. 现在 ,“Printout(N)” 已 对 每 -一 个 从 0 到 9 的 止 整 
数 做 出 定义 ， 而 更 大 的 正 整 数 则 通过 较 小 的 正 整数 定义 。 国 此 , 不 存在 循环 定义 。 整 个 过 程 S 
如 图 1-4 所 示 。 


void 


PrintOut( unsigned int N ) /* Print nonnegative M */ 





ift H >= 10 35 
PrirtOut( N / 10 3; 
PrintDigit( N € 10 9; 
} 


Po 


图 1-4 打印 整数 的 递归 例 程 

我 们 没有 努力 去 高 效 地 做 这 件 事 。 我 们 本 可 以 避免 使 用 mod 操作 ( 它 的 耗费 是 很 大 的 )， 
因为 N%10=N-LNAO]*10,° 
递归 和 归纳 

我 们 将 使 用 归纳 法 对 上 述 数字 递归 打印 程序 给 予 更 严格 的 证 明 。 

定理 1.4 

对 于 N20, 数 的 递归 打印 算法 是 正确 的 。 

ERARE N 所 含 数字 的 个 数 , 利用 妇 纳 法 证 明 ) 

首先 , MEN 只 有 一 位 数字 , 那么 程序 显然 是 正确 的 , 因为 它 只 是 调用 一 次 PrintDigit。 
然后 , it PrintOut 对 所 有 上 位 或 位 数 更 少 的 数 均 能 正常 工作 。 +1 位 的 数字 可 以 通过 其 胸 
位 数字 后 跟 一 位 最 低位 数字 来 表示 。 前 位 数字 形成 的 数 恰好 是 LNZ101, 归纳 假设 它 能 够 
被 正确 地 打印 出 来 , 而 最 后 的 一 位 数字 是 N mod 10, 因此 该 程序 能 够 正确 打印 出 任意 六 +1 
位 数 。 于是, 根据 归纳 法 ， 所 有 的 数 都 能 被 正确 地 打印 出 来 。 

这 个 证 明 看 起 来 可 能 有 些 奇怪 , 实际 上 相当 于 是 算法 的 描述 。 它 阐述 的 是 在 设计 递归 程 
Heb, 同一 问题 的 所 有 较 小 实例 均 可 以 假设 运行 正确 , 递归 程序 只 需要 把 这 些 较 小 问题 的 解 
(它们 通过 递归 奇迹 般 地 得 到 ) 结 合 起 来 而 形成 现行 问题 的 解 。 其 数学 很 据 则 是 归纳 法 。 我 们 
给 出 递归 的 第 三 个 法 则 : 

3. 设计 法 则 (design rule). 假设 所 有 的 递归 调用 都 能 运行 。 这 是 一 条 重要 的 法 则 , HAE 
意味 着 ， 当 设计 递归 程序 时 一 般 没有 必要 知道 短 记 管理 的 细节 ,不 必 试 图 追踪 大 量 的 递归 调 
用 ,追踪 实际 的 遂 归 调用 序列 常常 是 非常 困难 的 。 当 然 , 在 许多 情况 下 , ACAR TERE 
提 的 好 处 ,因为 计算 机 能 够 算出 复杂 的 网 忆 。 

递归 的 主要 问题 是 隐 售 的 得 记 开 销 。 BREA RLS REAR AAR AIX 
笛 化 『 算 法 设计 ， 而 且 也 有 助 于 给 出 更 加 简洁 的 代码 ) , 但 是 递归 绝 不 应 该 作为 简单 for 循环 
的 代替 物 , 我 们 将 在 3.3 闻 更 仔细 地 讨论 递归 涉及 的 系统 开销 。 


D jo (procedure) BIA SHE Ay void Z9 87 PAE. 
O UX [BAF RSE X HEC. 
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"P ETO, 关键 是 此 牢记 递 妇 的 四 条 基本 法 则 : 

|. 基准 情形 。 必须 总 有 某 些 基准 情形 ,， ESCA ABE ELH, 

2. BEAR SEL 对 于 那些 害 要 府 岂 求解 的 情形 , 每 一 次 递 册 调用 邦 必 须要 使 求解 状况 朝 接 
Ac Hee TA He ASAT [ul TES XE 

3. 设计 法 则 , BP A BA A AB Ee 13 - 

4. SR 8E E M (compound interest rule), 让 求解 一 个 问题 的 同一 实例 时 , CE [n] 
EE AIE H F E a ERI TAE- 

第 四 条 法 的 正确 性 则 将 在 后 面 的 章 p TEA, fi HEN DE TETEMS UI EA BSB fa 
单数 学 丽 数 的 值 的 想法 一 般 来 说 不 是 一 个 好 主意 . 其 道理 正 足 根据 第 四 条 法 则 。 只 归 在 头脑 
中 沁 住 这 些 法 则 , BLP BAe a IRI HEB T Hs 


总 结 

这 一 章 为 本 书 其 余部 分 建立 一 个 舞台 。 对 于 面临 大 盟 输 入 的 算法 ,和 它 贞 花费 的 时 间 赴 - 
个 判别 其 好 坏 的 重要 的 标准 .【 当 然 正确 性 足 最 重要 的 。) 速 度 是 相对 的 。 对 于 一 个 问题 企 - 
台 机 器 上 旦 快速 的 算法 存 可 能 对 另 一 个 问题 或 在 不 同 的 机 器 上 就 变 成 了 慢 的 。 我 们 将 华 下 一 
这 讲述 这 些 问题 ,并 将 用 这 里 这 论 的 数学 概念 建立 个 正式 的 模型 。 


练习 

1.] 编写 一 个 程序 解决 选择 问题 令 &= NW7Z2。 画 出 表格 显示 你 的 程序 对 于 N 为 不 同 值 的 
运行 时 间 。 

1.2 编 与 一 个 程序 求解 子 谜 游 戏 问题 。 

1.3 只 使 用 处 天 L/O 的 PrintDigit BR, 编写 -个 过 程 以 输出 任意 实数 (可 以 是 负 的 )。 

1 .4 CHa 


tH inclode filename 


HEA, EIRA XE filename 并 将 其 插 人 人 到 include 3E] b, include AAU AGRE; ATT 
i. 4t filename 本 身 还 可 以 包含 include 语句 , 但 是 显然 一 个 文件 在 任何 链接 中 部 不 能 包 
令 它 自己 。 编 写 一 个 程序 , 使 它 读 人 被 include 语句 修饰 的 一 个 文件 并 晶 输 出 这 个 文件 ， 
1.5 WH FAAA: 
a. log X « X MAPA X >00 成 立 。 
b. log A?) = BlogA 
1.6 求 下列 各 和 和; 


Ae d gs 


b. ND L 


I0 


RLF 


1.7 


»1.8 


估计 
A i L 


r={N/2! ! 


2° (mod 5) Ik zb? 


1.9 4 F, EE 1.2 Ti PALABRA. 证明 下 询 各 式 : 
a. VF = Fy —2 
b. F< AY, Hoe $-(19/5)72 

x « c. 给 出 by 准确 的 封闭 形式 的 表达 式 。 

1.10 HERA RSA, 

a. v (Gi -)-2N 
Ni M 
b. P= (My 
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Ble 算法 分 析 


Fok (algorithny E ACR A 一 个 器 题 震 要 音箱 的 、 帘 清楚 地 指定 的 简单 指令 的 集合 . 对 于 
个 汪 题 ,号 给 定 革 种 算法 并 于 5 以 某 种 方式 ) 硝 定 其 是 正 丧 的 , AS A ER- 2 aE 
议 算 法 将 南 归 多少 诸如 时 间 战 空间 等 资 薄 量 的 问题 : 如果 一 个 问题 的 求解 算法 映 要 长 也 一 个 
"jg, 35 TGXRPEIESRROGSEAG TÉ ZAHME A om IG AER ETE SA A fe 
Wala LL eA | 
件 这 -Ẹ, 我 们 将 讨论 ， 
* 由 | 何 佑 让 一 个 程序 所 需要 的 时 间 ， 
© 如 何 将 一 个 程序 的 运行 时 间 从 大 或 年 降低 到 种。 
+ 料 心 地 使 用 递归 的 后 梁 : 
© 将 一 个 数 和 月 屁 得 到 其 戎 以 及 计算 两 个 数 的 最 大 会 负数 的 非常 有 效 的 算法 . 


2.1 数学 基础 


估计 算法 资源 消 桂 所 需 的 分 析 一 般 说 来 是 … 个 理论 问题 , 内 此 嵩 本 -一 公正 式 的 系统 构 
7t 我 们 先 从 革 些 数学 定义 开 妨 . 

全 书 将 使 用 下 列 下 个 定义 : 

定义 :如 果 存 在 下 常数。 Aly ES Nie ye IM TON) Sef CN). 则 记 为 T(N) = 
OUFONY) 

TES WOE TE EE BE o T no EAR YT NE ug BE TUN) eg (NO. 则 记 为 PON) = 
Moe(N)). 

JEM: TON) = O(A(N)) MAIS T(N) OU (ND A. TON) = 0 QU NY)), 

EM TONS OLINDA TON) 4 GCpOND), M TON) = oCpGON )) “Ts! 

pee X559 BS ESSE ee E AS, BPR. RA evi. 
A jus pr —A4 PR RE AF — ee, 因此 , 像 OND <a CN Dx EI TT 
ote gay. 于是, Fete e848 SE # relarive rate of growth). MRS FH TSS ICE A 
到 算法 分 析 的 时 候 , 我 们 将 会 明白 为 什么 它 是 车 要 的 度量 ， 

BIR N 较 小 时 , 1 000N EE EE NT 大 , 但 N? 以 更 快 的 速度 增长 . 因此 N° RREK, dE 
这 种 情况 下 ，N = 1000 是 转折 点 。 第 一 个 定义 是 说 ， RARER ny. MEM 
cc ON) Ab TON CMA. 从 而 若 铂 路 常数 因子 , 则 PONDS EON RR 
AFR BORIS. PON) =1000N, FOND 2 N?, ap=Lb00 前 =1 .我们 也 可 以 让 mn 一 多 
le = LOO. tk, 我 们 可 以 说 1000N = OUND(N 平方 级 ) 这 种 记 法 称 为 大 O 记 法 AE 
WIN ALE ene 级 的 ”, HD AER CA Oe "6 

i 3e CR PL ASO ERU HE E. AB A TEL RE OT jim 

LLU FUN DEO S.I 第 一 个 定妆 DM VR. "omega" SER TON IR RER 
Y* TOS ON AOR. SRL TEX TON) ACN) CB ane isi TENGAH 
KREE = ACN AHR 最 后 - Mad PUN) cat pt) CEH om 697 )gL a AE 


d2 PIE 
T(N) 的 增长 率 小 于 (之 }p(NN) 的 增长 率 . 它 不 同 于 大 口 , 因为 大 O 包含 增长 率 相 同 这 种 可 
能 性 。 

为 了 证 明 某 个 函数 TON) OUND, 我 们 通常 不 是 形式 地 使 用 这 些 定义 , 而 是 使 用 -一 
些 已 知 的 结果 ,一般 说 来 , 这 就 意味 着 证 明 ( 或 确定 假设 不 成 立 ) 是 非常 简单 的 计算 并 不 涉及 
微 积分 , 除非 遇 到 特殊 的 情 襄 (不 可 能 发 生 在 算法 分 析 中 ): 

当 我 们 说 TON) = OCFOND it, 我 们 是 在 保证 函数 了 CN) 是 在 以 不 快 于 A(N) 的 速度 增 
K; 因此 FON) FE TON) — EX (upper bound). 与 此 间 时 ，f(N) =Q(T(N)D BRA 
TON) FE FON) — FF ower bound )。 

作为 一 个 例子 ，N3 增长 比 NT 快 ， 因 此 我 们 可 以 说 N = OCN? aR ON? = Q0N7), FOND) 
= NM 和 gw)J=2N2 以 相同 的 速率 增长 , 从 而 FON) = OC (ND) FON) = (gg NDARE 
正确 的 。 当 两 个 函数 以 相同 的 速率 增长 时 , Rmus Be ICS "80" Raa BER MT AA 
上 下 文 。 直 疯 地 说 , 如 果 gf(N)=2N2, ABA g(N)=OC(N*), g(N)=O(N*) RI g(N) = 
OUN2) 从 技术 上 看 都 是 成 立 的 , 但 最 后 一 个 选择 是 最 好 的 答案 。 写 法 g(N)= ON) ALE 
A g(N) = OUON2) 而 且 还 表示 结果 会 尽 可 能 地 好 (严密 )。 

我 们 需要 掌握 的 重要 结论 为 ; 

法 则 1: 

如 果 TON) = OC FCN) EB T20N) = OC g(N)), ABA 

(a)T,(N) + T20N)=max(OCf(N)), OCZON))), 

(b) TUN) * T4UN) OLEN)» gU ND). 


法 则 2: 
如 果 TON) k 次 多 项 式 , 则 T(N)- CN), 
法 则 3: 


EPH k, log N = O(N)。 它 告诉 我 们 对 数 增 长 得 非常 缓慢 。 

这 些 信 息 足 以 接 照 增长 率 对 大 部 分 常见 的 哺 数 进行 分 类 ( 见 7 
图 2-1)。 

现在 指出 几 点 注意 。 首 先 , 将 常数 或 低 阶 项 放 进 大 O 是 非常 
坏 和 的 习惯 ,不 要 写成 T(N}= OC2N7) 8 TUN) = OCGN^- N), 在 
这 两 种 情形 下 , 正确 的 形式 是 T(N) = O(N?)。 这 就 是 说 , Ei 
要 天 表示 的 任何 分 析 中 ,各 种 简化 都 是 可 能 发 生 的 。 低 阶 项 一 
般 可 以 被 忽 路 ,而 常数 也 可 以 和 弃 掉 。 此 时 ,要 求 的 精 魔 是 很 低 的 。 

第 二 , 我 们 总 能 够 通过 计算 极限 lim FCN) /g (NRA EBT 图 2-1 典型 的 增长 率 
ÄR FON) RI g(N) 的 相对 增长 率 ， 必要 的 时 候 可 以 使 用 洛 必 达 法 则 。 该 极限 可 以 有 了 下 种 可 
能 的 值 ; 

。 极限 是 0; 这 意味 着 FUN) = oC g COND) « 

。 极 限 是 。 关 0: 这 意味 着 (CN) = OCR UND: 





cO» HERATSNICL! Hopital’ s rule) 说 的 层 , A hm (N) 2 99 R. lim x CN) - wo, 则 im FCN) Zg (ND = Tim FNMg' 
EN), 而 六 CN) 和 (NN) 分 别 足 AN} 和 gtN) 的 导数 。 


© 极限 是 ooe ;这 意味 着 BN) — oCFUND). 

© 极限 摆动 :二 者 无 关 ( 在 我 们 的 书 中 将 不 会 发 生 这 种 情形 ) 

使 用 这 种 方法 几乎 总 能 够 算出 相对 增长 率 。 通 各 ,两 个 果 数 FON) FI eg CONO BIB S A RI 
VISAS RE 344589 58. Glin, E FON) N legN Ale (ND =N'O. 那么 确定 FONDA 
ce UNDIS IB EUER, SEES RE log N UNT OWE PS eR. xx Gf E log N MN 
WEM E gH ME BER, 而 后 者 是 个 简单 的 问题 ,因为 我 们 已 经 知道 ，N 的 增长 要 快 二 log 
(SE BRE. DUC, E CN) 的 增长 快 于 ANIR. 

另外 ,在 风格 上 还 说 注 意 ; 不 要 说 成 FONOS OCN) Ane MU She E Sa 
让 HR SOND Z Olg NERAN], ERMA e 


2.2 模型 


为 了 在 正式 的 框架 中 分 析 算法 , RTE PR, FRA RAS Kie- frd 
的 计算 和 机， 在 初 器 中 指令 被 顺序 地 执行 .该 模型 有 -个 标准 的 简单 指令 系统 , WANA REA, 
比较 和 峰值 等 , 但 不 同 于 实际 计算 机 情况 的 是 , 模型 机 做 任 一 件 简单 的 工作 部 恰好 花 寓 一 个 
时 间 单 元 。 为 了 合理 起 见 , 我 们 将 假设 我 们 的 模 霸 像 一- 台 现 代 计 算 机 那样 有 固定 范围 的 整数 
(比如 32 个 比特 ) 并 且 不 存在 诸如 盾 阵 求 北 或 排序 等 运算 , 它们 显然 不 能 在 一 个 时 间 单 位 内 
完成 . 我 们 还 假设 模型 机 有 无 限 的 内 存 。 

BR. 这 个 模型 有 些 缺点 。 很 明显 , 在 现实 生活 中 不 是 所 有 的 运算 部 恰好 化 费 相同 的 时 
特别 地 .在 我 们 的 槛 型 中 , 一 次 位 总 读 人 记 时 间 一 次 加 法 , 虽然 加 法 ~- 般 要 快 几 个 数量 
级 ,。 还 有 , 由 于 假设 有 无 限 的 存储 , 我 们 再 不 用 拒 心 缺 页 中 断 , 它 可 能 是 个 实际 问题 , 特别 是 
对 商 效 的 算法 : 


2.3 要 分 析 的 问题 


要 分 析 的 最 重要 的 资源 一 般 说 来 就 是 运行 时 间 。 有 几 个 内 素 影 响 着 程序 的 运行 时 间 。 有 
此 因素 如 所 使 用 的 编译 器 和 计算 机 显然 超出 了 任何 理论 模型 的 范畴 , 因此， 虽然 它们 是 重要 
的 , 但是 我 们 在 这 蛙 还 不 能 处 理 它们 。 剩 下 的 主要 因素 则 是 所 使 用 的 算法 以 及 对 该 算法 的 
HA 

典型 的 情形 是 , 输入 的 大 小 是 主要 的 考虑 方面 。 RE LT BH Tuy (N) 
CN), 分 别 为 输入 为 N 时 ,算法 所 花费 的 平均 运行 时 间 和 最 坏 情况 下 的 运行 时 间 , 显 
R, Tag NYS Poona No 如 果 存在 更 多 的 输入 , 那么 这 些 函 数 可 以 有 更 多 的 变量 。 

_ Ae. 车 无 相反 的 指定 , 则 所 需要 的 量 是 最 坯 情况 下 的 运行 时 间 。 其 原因 之 -是 它 
对 所 右 的 输入 提供 了 一 个 界限 ,包括 特别 坏 的 输入 ,而 平均 情况 分 析 不 提供 这 样 的 界 另 一 
个 原因 是 平均 情况 的 四 计算 起 来 通常 要 几 难 得 多 。 在 某 此 情况 下 ,“ 平 均 ” 的 定义 可 能 影 喇 分 
析 的 结果 。( 例 如 . 什么 是 下 述 问题 的 平均 输 人 ?) 

作为 -个 例子 , 我们 将 在 下 - - 节 考 虑 下 述 问 题 : 
最 大 的 子 序列 和 问题 : 

给 定 整数 A,，A;，...，Aw( 可 能 有 负数 ), RDO) A 的 最 大 信 (为 方便 起 见 , 如 内 所 


如 牧 数 均 为 负数 ， 则 晤 大 子 序 列 各 为 00)。 


hay 


(48; 


FEE: 


fni : 

输入 一 2, 11, -4, 13, —5, -2 时 , 答案 为 20( 从 A; 到 Az), 

这 个 问题 所 以 有 了 暴 引 力 , 主要 是 因为 存在 求解 它 的 很 多 算法 , 而 这 些 算法 的 性 能 义 差 异 
RA. 我 们 将 讨论 求解 该 问题 的 四 种 算法 。 这 四 种 算法 在 某 台 计算 机 上 (究竟 是 哪 一 台 具 体 
的 计算 机 是 不 重要 的 ) 的 运行 时 间 在 图 2-2 给 出 。 


0.00066 0.00034 


0,004386 0.DD063 
0.05843 0.00333 
0.58631 0.03042 
8.0113 0.29832 





图 2-2 计算 最 大 于 序列 和 的 几 种 算法 的 运行 时 间 ( 秒 ) 


表 中 有 几 个 重要 的 情况 值得 注意 。 对 于 小 量 的 输入, SHEAR aS a, ASU A dE 
小 量 输入 的 情形 , 那么 花费 大 量 的 努力 去 设计 聪明 的 算法 怒 怕 就 太 不 值得 了 。 为 一 方面 , 近 
来 对 于 重 写 那些 不 再 合理 的 基于 小 输入 量 假设 而 在 五 年 以 前 编写 的 程序 确实 仓 在 寿 巨 大 的 市 
场 。 现 在 看 来 , 这 些 程序 太 慢 了 , 因为 它们 用 的 算法 不 是 好 算法 。 对 于 大 晨 的 输入 , 算法 4 显 
然 是 最 好 的 选择 (虽然 算法 3 也 是 可 用 的 )。 

其 次 ,， 表 中 所 给 出 的 时 间 不 包括 读 人 数据 所 需要 的 时 间 。 对 于 算法 4, 仅仅 从 伐 盘 该 人 
数据 所 用 的 时 间 很 可 能 在 数量 级 上 比 求解 上 述 问题 所 需要 的 时 间 还 要 太 。 这 是 许多 有 效 算法 
中 的 典型 特点 。 数据 的 读 入 一 般 是 个 瓶 翁 ; 一 日 数据 读 人 , 问题 就 会 迅速 解决 但 是 , 对 于 低 
效率 的 算法 情况 就 不 同 了 , 它 必 然 要 耗资 大 量 的 计算 机 资源 。 因 此 只 要 可 能 , 使 得 算法 足够 
有 效 而 不 致 成 为 问题 的 瓶 堪 是 非常 重要 的 。 

图 2.3 指出 这 四 种 算法 运行 时 间 的 增长 举 。 尽管 该 图 只 包含 N 从 10 到 100 BR, 但 是 
相对 增长 率 还 是 很 明显 的 。 虽然 算法 3 的 图 看 起 来 基线 性 的 , 但 是 用 一 把 直 尺 (或 是 一 张强 ) 
容易 验证 它 并 不 是 直线 。 图 2-4 显示 对 于 更 大 值 的 性 能 。 该 图 戏剧 性 地 描述 击 ， 即 使 输入 量 
的 大 小 是 适度 的 , 低 效 算法 依旧 无 用 。 
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2.4 运行 时 间 讨 算 


有 用 种 方法 估计 一 :个 程序 的 运行 时 间 。 BT EE EA SBS. 如 果 两 个 程序 花费 的 
时 间 大 致 相同 , 要 确定 哪个 程序 更 快 的 最 寻 方 法 很 可 能 就 是 将 它们 编码 并 运行 ! 

Wea, 存在 几 种 算法 思想 , 而 我 们 总 愿意 尽早 除去 那些 不 好 的 算法 思想 , 因此 , RS 
需要 对 算法 进行 分 析 。 不仅 如 此 , 进行 分 析 的 能 力 太 有 助 于 洞察 到 如 何 设计 和 有 有效 的 算法 。-- 
般 说 来 ,分 析 还 能 准确 确定 需要 什 细 织 码 的 报 领 - 

为 了 简化 分 析 , 我 们 将 采纳 如 下 的 约定 :不 存在 特定 的 时 间 单 位 。 因此 , RMR. 
我 们 还 将 抛弃 低 阶 项 ， 从 而 我 们 要 做 的 就 是 计算 大 O 运行 时 间 。 由 于 大 O 是 -- 个 上 界 . 因 
此 我 们 必须 仔细 ,， 绝 不 要 低估 程序 的 运行 时 间 -。 实际 上 , 分 析 的 结果 为 穆 序 在 一 定 的 时 问 范 
于 内 能 够 终止 运行 提供 了 保障 。 程序 可 能 提前 结束 . 但 绝 不 可 能 拖 后 。 

2.4.1 一 个 简单 的 例子 
这 里 是 计算 SD” RPE: 
ini 
Sum int N 3 
{ 
int 3, PartiatSum; 


fe lI") PartialSum = 0; 


fr Qj forlì = 1; d <= Ħ; i++ } 
fr 3*/ PartialSum += i * 7 * i; 
ft 4*/ return PartialSum; 

} 


对 这 个 程序 的 分 析 很 简单 。 声明 不 计时 间 。 第 1 行 和 第 4 TST oc, 95 313 
每 执行 -次 占用 四 个 时 间 单 元 (两 次 乘法 ,一 次 加 法 和 一 次 赋值 ), 而 执行 N DOES AN T 
时 间 单 元 .第 二 行 在 初始 化 二 测试 ISN 和 对 i 的 自 增 运算 中 隐 含 着 开销 。 ADAE E 
销 蚌 初始 化 1 个 时 间 单元 , 所 有 的 测试 N 1 | 个 时 间 单 元 , 以 及 所 有 的 白 增 运算 N 个 时 同 单 
35. THIN +2, 我们 忽略 调用 函数 利 返 口 什 的 井 销 ， (Sa) MELON t4, AE, Ril bee 
是 ON). 

如 果 我 们 每 次 分 析 一 个 程序 都 要 演示 所 有 这 些 工 作 , 那么 这 项 任务 很 快 误会 变 成 个 al ay 


| 


| 20] 
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KIC. SBN, 由 于 我 们 有 大 OKER, 因此 就 存在 许多 可 以 采取 的 捷径 并 册 不 影响 
最 后 的 结果 , 例如 , 第 三 行 ( 每 次 执行 时 ) 显 然 是 OY, AUIS COTE. XB 
是 四 个 时 间 单 死 大 思春 的 ; 这 无 关 紧 要 。 第 一 行 与 fcr 循 环 相 比 显然 是 不 重要 的 , 所 以 在 这 里 
花费 时 间 也 是 不 明智 的 。 这 使 得 我 们 得 到 大 干 -一 般 法 则 。 
2.4.2 一 般 法 则 

法 财 1 一 一 FOR fa : 

一 次 for 社 环 的 运行 时 间 至 多 是 该 for 循环 内 语 自 (包括 测试 ) 的 运行 时 间 来 以 选 代 的 

[21] E. 

法 则 2— —EE TER) for TAM 

队 里 向 外 分 析 这 些 循环 。 UE I e E ER A SR RS 6) a iE TR IR] AE ARIS 61 WIRT 
时 间 乘 以 该 组 所 有 前 for Ee X rb e XR. 

作为 一 个 例 于 , 下 列 程序 片段 为 ON’): 


for( i= 0; i < N; d 
fort j = 0; j < M; j++ 2 


ktts 

法 则 3 一 顺序 语句 

将 各 个 语句 的 运行 时 间 求 和 即 可 (这 意味 着 ， 其 中 的 最 大 值 就 是 所 得 的 运行 时 间 ; 见 2.1 
节 的 法 则 1(a))。 

作为 一 个 例子 , FEARS BEB OCN) ,再 花费 OCN?) ,总 的 开销 也 是 O(N2) 


fort i = 0; 1 <N; i++ ) 
AT i 7 = 9; 


法 则 4 IF/ELSE i& f] 
wy TAZ AB a 


ifi Condition ) 
51 





else 
a2 


一 个 jeise 语 身 的 运行 时 间 从 不 超过 判断 再 加 上 51 和 S2 中 送行 时 间 长 者 的 总 的 运行 
时 间 - 

虽然 在 某 些 情形 下 这 么 估计 有 些 过 高 , 但 绝 不 会 估计 过 低 。 

其 他 的 法 则 都 是 显然 的 , 但 是 ， 分 析 的 基本 策略 是 从 内 部 (或 最 深层 部 分 } 向 外 展开 的 。 
如 果 有 函数 调用 , 那么 这 些 调用 要 首先 分 析 。 如 果 有 递归 过 程 , 那么 存在 几 种 选择 。 右 迪 归 
实际 上 只 是 被 薄 面 纱 迹 住 的 for 循环 , 则 分 析 通 常 是 很 简单 的 。 例如 , 下面 的 函数 实际 上 就 在 
- -个 简单 的 循环 ， 从 而 其 运行 时 间 为 OCN): 


long int 
Factorial( int N ) 
{ 
iff N <= 1) 
return i; 
else 
return N * Factorial( M - 1); 
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循环 结构 是 相当 国难 的 ， 在 这 种 情况 下 , 分 析 将 涉及 求解 -- 个 衣 推 夫 系 。 为 了 观察 到 这 种 可 
能 发 生 的 情形 ,考虑 下 列 程序 , Kir EENEI E HIRIRA RIE 
long int 
Fib€ int N 3 
fe 1*/ MCN c= 1) 
fe aes return 1; 


else 
ft 3j return Fibl N - 1 3 + Fbi N- 2 4; 
i 


HARE. BAFER EHER RAR. WE, up E eS, MREP N RÉ 
30 的 值 并 运行, 那么 这 个 程序 让 人 感到 效率 低 得 吓人 .分 析 十 分 简单 . 今 TUON) AAR 
b(tN) 的 运行 时 间 , 如 果 N=O Re N= 1, We tee E EE. 即 第 - 行 上 做 判 新 以 
此 返回 所 用 的 时 间 。 因为 常数 并 不 重要 ,所 以 我 们 可 以 说 TO= T(1)2 I. MPN 的 其 他 
值 的 运行 时 间 则 相对 竹 基 准 情形 的 运行 时 间 来 度 电 , 若 N > 2. 则 执行 该 了 数 的 时 间 是 入 一 
行 上 上 的 常数 工作 如 上 第 三 行 上 的 下 作 . 第 二 行 由 一 次 所 法 和 两 次 国 数 调用 组 成 , HI FP iad] 
用 不 是 简单 的 运算 ， 必 须 通 过 它们 本 匡 来 分 析 。 第 - -次 好 数 调用 是 Fib CN — 1), 从 而 按照 了 
HEL, ERE TON -1 个 时 间 单 元 .类似 的 论证 指出 , BOA RR AA tN 一 2) 个 
有 时间 单元 。 此 时 总 的 时 间 需 求 为 TUN D+ T(N-2) &2. 其 中 "2” 指 的 是 第 -- 行 于 的 志 作 
th EAS cfr RAE. 于 是 对 于 N LO RG POA Fib NOBQETIBPIZIE 

T(/N)- T(N-)) ! TON-2)+2 
但 是 Fib( N)- Fib(N — 1) - Fib( N- 22, 因此 由 归纳 法 容易 证 明 TON) FibCN). 在 
1.2.5 节 我 们 证 明 过 FIBCN) « 73)", 类似 的 计算 可 以 证 明 ( 对 于 NN > 4) FIBCND ZR 
DY, 时 见 ， 这 个 程序 的 运行 时 间 以 指数 的 速度 增长 , 这 大 致 是 最 不 的 情况 ,通过 人 殿 留 一 个 衣 
第 的 数组 并 使 用 . -个 for 循环 ,运行 时 间 可 以 被 实质 性 地 减少 下 来 、 

这 个 称 序 之 所 以 缓慢 、 是 因为 存在 大 量 多 余 的 工作 要 做 ,违反 了 和 奉节 1.3 P SUR S 3 
的 第 四 条 主要 的 法 则 (合成 效益 法 则 )。 注意 , 在 第 二 行 上 的 第 - :次 调用 即 FibON 一 上) 实际 二 
HET FIbCN-2), 这 个 信息 被 抛弃 而 在 第 三 行 上 的 第 二 次 调 内 时 又 重新 计算 了 一 这 MF 
的 信息 量 递 妇 地 合成 起 来 并 导 孝 巨大 的 运行 时 间 ., 这 战 许 是 属 言 “计算 任何 事情 个 要 起 过 一 
次 ”的 最 好 的 实例 , 但 它 不 应 使 你 被 中 得 远离 递 11 而 不 地 使 用 它 : 本 书 中 我 们 将 随处 看 到 弟 
归 的 出 色 的 使 用 。 

2.4.3 最 大 子 序列 种 问题 的 解 

现在 我 们 将 要 叙述 四 个 算法 来 求解 早先 提出 的 最 大 子 序 列 和 问题 . 第 一 个 算法 在 图 2.5 
中 表述 , 它 只 是 穷 举 式 地 尝试 所 有 的 可 能 . for 循环 中 的 循环 变 大 反映 (中 数组 从 1 开始 而 二 
是 从 1 开始 这 样 一 个 事实 。 再 有 ,本 算法 并 不 计算 实际 的 子 序 亿 ; APRIL ERST 一 二 
Bul bY A? 

该 算法 肯定 会 正确 运行 (这 不 应 该 花 太 多 的 时 间 具 证 内) 运行 时 间 为 OCN?), xx Se ek 
drussqmeet;.6tim--TST HERE for HTH 0 (1) 语句 组 成 , 88 2 fT E88 
循环 大 小 为 N: 

第 2 个 循环 大 小 为 Ni, 它 可 能 要 小 , 但 也 可 能 是 N. 我 们 必须 假设 最 坏 的 情况 ,| 而 这 
可 能 会 使 得 最 终 的 界 有 些 大 。 第 3 个 循环 的 大 小 为 了 -了 + 我 们 世 要 假设 它 的 大 小 为 N, 
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LE 


因此 总 数 为 O(N.N-N)= O(N3), 语句 1 总 共 的 开销 只 是 OC, TERI 7 和 8 总 共 开 
销 也 只 不 过 O(N?)， 因为 它们 只 是 两 层 循环 内 部 的 简单 表达 式 。 



















int 
MaxSubsequencesum( const int AL J], int N 2 


int ThisSum, MaxSum, 1d, j, K; 





MaxSum = D; 


fe Oy fort i = 0; ix N: in) 
po f® Bef for( j= i; j < N; j++ 3 
1 
f* A ThisSum = 0: 
f* Sy for( k = i; k <= j; k++ 3 


ThisSum += AL k 7; 


if ThisSum > MaxSum ) 
Maxsum = ThisSum: 


} 
return MaxSumt: 





} 


图 2-5 算法 1 


事实 上, 考虑 到 这 些 循 环 的 实际 大 小 , 更 精确 的 分 析 指 出 答案 是 GUNT), 而 我 们 上 而 的 
估计 高 出 个 因子 6( 不 过 这 并 无 大 碍 , 因为 常数 不 影响 数量 级 )。 一 般 说 来 , 在 这 类 问题 中 上 
述 结论 是 正确 的 。 精确 的 分 析 由 和 007 02] 51 14880, 该 和 指出 程序 的 第 6 行 被 执 
行 的 次 数 。 使 用 1.2.3 节 中 的 公式 可 以 对 该 和 从 内 到 外 求 值 。 特别 地 , 我 们 将 用 到 前 N 个 束 
数 求 和 以 及 前 N 个 平方 数 求 和 的 公式 。 首 先 我 们 有 


接着 , 我 们 得 到 


Sys jist 
E—i 


3I ~74D= CN EDN i) 


这 个 和 数 是 对 前 N - i 7 个 整数 求 和 而 算得 。 为 完成 全 部 计算 , 我 们 有 
Y (N= i+ DON =) E S (N-i+1)(N-i+2) 
i- - i=] 2 


N N N 
1 - (N +3) iri NN 271 
=] 1 r=1 


N(IN+DGN 11 - (w+ ZAAD NAINA 2y 


ON? 4+ 3N%4+2N 
E 6 


我 们 可 以 通过 撤除 一 个 for 循环 来 避免 立方 运行 时 间 , 不 过 这 不 总 是 可 能 的 , 在 这 种 悄 
况 下 算法 中 出 现 大 量 不 必要 的 计算 。 纠 正 这 种 低 效率 的 改进 算法 可 以 通过 观察 Ae 一 
A, + 9315 A 而 看 出 , 因此 算法 1 中 第 5 行 和 第 6 行 上 的 计算 过 分 地 耗 时 了 。 图 2-6 指出 一 


种 改进 的 算法 。 算 法 2 显然 是 OCN?); 对 它 的 分 析 甚 至 比 前 面 的 分 析 还 简单 。 


对 这 个 问题 有 一 个 递归 和 相对 复杂 的 O(N logN) 解 法 , 我 们 现在 就 来 描述 他。 要 是 真 的 





int 
MaxSubSeguencesSum( const int AL ], int h ? 


| 

| 

| i 

| int ThisSum, Maxsum, 1. 5; 
| 

| 


ÁÓS it MaxSum = O 

fv ae for€ 1 = 0; 7 e NM; des 3 | 
QU YF ThisSum = 0; | 
fe avs forg j =a: j < Ni j++) ! 
i | 
| fe Gr ThisSum -= Ai d ft ， 
| 1 
A By iff ThisSum > Maxsum j) | 
| fe FF MaxSum = Th?s&um; i 
| ' i 
! | 

| /* Be return MaxSum: 

i 
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MEHL OUNj( 线 性 的 ) 解 法 ， 这 个 算法 就 会 是 体现 递归 威力 的 极 好 的 范例 了 该 方法 采用 d 
At órifitdivide-and-conquer)" ER. Hos LEE oy 888 p P T ACE ASA P RI. SA ID a LI 
nog JSR. axi a Ra. u^ BA BEE BY > T ER BP tepi H] REHE TP S 
BST E. Hx PEE T oe E 

在 我 们 的 的 子 中 . 最 大 子 序列 和 可 能 在 三 处 出 坝 - 或 者 更 个 出 现在 输入 数据 的 大 于 部 ， 
REANG EE, 或 者 跨越 输 人 数据 的 中 部 从 而 凸 所 左右 两 半 部 分 : 前 两 各 情况 可 以 
递归 求解 第 三 种 情况 的 最 大 和 可 以 通过 求 出 前 半 部 分 的 最 大 和 (包含 前 半 部 分 的 最 后 一 个 
元 索 ) 以 及 后 半 部 分 的 最 大 和 (包含 后 半 部 分 的 第 一 个 元 葵 ) 而 得 到 . 然后 将 这 两 个 利加 下 
起 作为 一 个 例子 ， 考虑 下 列 输入 : 


前 半 部 分 O RABA 
d —1 à E - | à n 


此 中 前 半 部 分 的 最 天 子 序 列 和 为 6( 从 元 素 A88 A D ERA RAT Tr PURUS: BC Mt 
3X A, FAs). 

MDE BAFIL HEUS PICK WBA ALE AATA A, 到 A4). uii RIBS) fl N 
个 匹 率 的 最 天 和 是 7 NOt As 到 As). AR. 横路 这 两 部 分 及 道 过 中 全 的 最 太 和 为 4+7=11 
(Moca A, 到 Az). 

我 们 看 到 ,在 生成 本 例 中 最 大 子 序 别 和 的 二 种 方法 中 , 最 好 的 方法 起 包含 两 部 分 的 元 
# 十 是 , 等 案 为 11。 图 2-7 提 出 了 这 种 策略 的 一 种 实现 于 段 ; 

右 必要 对 算法 3 的 程序 进行 一 些 说 明 , 递 申 过 程 油 用 的 一 般 蕊 式 是 传递 输入 的 煞 组 以 从 
大 (let 边界 和 右 fright) 边 界 ,它们 和 愉 定 了 数组 要 第 处 理 的 部 分 : LET BUS] E SD P CH. 
VL REO GRIN 一 1 而 启动 该 过 程 ， 

第 1 行 至 第 4 行 处 理 基准 情况 。 ME Left = = Right, 那么 只 有 一 个 元 素 , 并 上 于 该 元 
素 非 负 时 它 就 是 最 大 和 了 序列. Left > Right 的 情况 是 不 可 能 出 规 的 , 除非 N 是 负数 (不 
aE. 程序 中 的 小 的 挑动 有 可 能 敏 使 这 种 混乱 产 咎 )。 第 6 行 和 第 ? 行 执行 两 次 递归 调用 。 我们 
TUES, BAS b+ Ra BET, (ALPE FE re cde oft FF aT f QR ix Tj 
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static int 

faxSubSum const int AÇ T, int Left, int Right ) 

int MaxLeftSum, MaxRight5um; | 
int MaxLeftBorderSum, MaxRightBorderSum; 

int LeftBordgrSum, RightBorderSum; 

int Center, 7; 







/* 1*/ if( Left == Right ) /Ar Base Case */ 
f* 2*/ ifC AE Left] > 0) 
A 3*f/ return A( Left 7: 
else 

fe anf return 0; 
/* $*/ Center = ( Left + Right ) / 2; 
ft &*/ MaxLeftSum = MaxSubSum( &, Left, Center ); 
y" Ty MaxRightSum — Max5ubS5um( A, Center + 1, Right 3; 
/* B*/ MaxLeftBorderSum = 0; iLeftBerder5um = 0 
/* 9*/ for( i = Center: i >= Left: i-- ) 

{ 
/*10*/ LeftBordersum += Àj i ]; 
ft, ift LefrBordersum > MaxLeftBorderSum ^ 
/*12*/ MaxLeftBorderSum = LeftBorderSum; 

} 
/*13*/ MaxRightBorderSum = 0; RightBorder*sum = D; 
/*14*/ for( 7 = Center + 1; i <= Right; j++ } 

{ 
/*15*/ RightBorderSum += AL i ]; 
/*l6*/ ifi RightBorderSum > MaxRightBorderSum ) 
/*17*/ MaxRightBorderSsum = RightBorderSum; 





} 


/*18*/ return Max3( MaxLeftSum, MaxRightSum, 
/*19*/ MaxLeftBorderSum + MaxRightBorderSum ); 
} 







int 
MaxSubsequenceSum( const int AL ], int N3} 






return MaxsubSum( 4, 0, N - 13; 
} 






图 2-7 算法 3 


H. 第 8 行 至 第 12 行 以 及 第 13 行 至 第 17 行 计算 达到 中 间 分 界 寻 的 两 个 最 大 和 的 和 数 , 这 两 
个 最 大 和 的 和 为 扩展 到 左右 两 边 的 最 大 和 和。 TAI ( pseudoroutine) Max3 返回 这 三 个 可 能 的 最 
太 和 中 的 最 大 者 。 

虽然 ,编程 时 ,算法 3 比 前 面 两 种 算法 需要 更 多 的 精力 。 然而, 程序 短 并 不 总 意味 着 程序 
好 。 正 如 我 们 在 前 面 显 示 算法 运行 时 间 的 表 中 已 经 看 到 的 , 除 最 小 的 输入 外 , 该 算法 比 前 两 
PRE BRR, 

EE al i4 ELA ESEA SE a PR TON ) 是 求解 大 
小 为 N 的 最 大 子 序 列 和 问题 所 花费 的 时 间 。 如 果 N= 1, 则 算法 3 执行 程序 第 11752955 4 13 
ERESHE, 我 们 称 之 为 一 个 时 间 单 元 。 于 是 ，T(1) = !。 否则 , 程序 必须 运行 两 次 过 
归 调 用 , 即 在 第 9 行 和 第 17 行 之 间 的 两 个 for 循环 , 还 需 某 个 小 的 夭 记 其 ,如 在 第 5 行 和 第 
18 行 。 这 两 个 for 循环 总 共 接 触 到 从 Ay 到 Aw-1 的 每 一 个 元 素 , 而 在 循环 内 部 的 工作 量 是 常 
ER. 因此 , 在 第 9 到 17 行 花费 的 时 间 为 O(N)。 第 1 行 到 第 5 行 ,第 8、13 和 和 18 行 上 的 程序 
的 工作 量 都 是 常量 , 从 而 与 OCN) 想 比 可 以 忽略 。 其余 就 是 第 6、7 行 上 运行 的 工作 。 x HT 


HO Dp BF 21 
求解 大 小 为 N72 的 子 序 列 问题 { 假 没 N EARO. 因此 , 这 两 行 每 行 化 费 TON /2) 个 时 间 单 
Ju. SEAR 27TCN /2D 个 时 间 单元 算法 3 花费 的 总 的 时 间 为 2TCNA2) + OCND 我 们 得 到 
方程 组 

T(i) =1 
TON) = 2TON/2) + O(N) 

为 了 简化 计算 , 我 们 可 以 用 NRE PR OCN ST, 由 于 TOCN) 最 终 还 是 要 用 大 
来 去 示 的 ,因此 这 么 做 并 不 影响 答案 , 在 第 7 E. 我 们 将 会 看 到 如 和 何 严格 地 求解 这 个 方程 . 
至 于 现在 ,如 时 TON) =2T(N/2)4+N, A T(D -1. WA 1(2) 74-72 * 2. T(4) 212-7 
4 * 3. T(8) 232-28 * 4, UR 1(16) - 80 716 « 54 HBR BRAT A]. ED 
4: N=2*, MW TCN) 2 N x (2+ DD N log NN OCXN log N). 

MTOR N 是 偶数 , 因为 否则 NN/2 就 不 确定 卫 。 通过 该 分 析 的 递归 性 质 可 知 ,， 实 
REHA N E2 BEH, SRR CHA, 否则 我 们 晤 终 要 员 到 闫 小 不 是 偶 数 的 子 问题 ， 
方程 就 无 效 了 。 当 NN 不 是 2 的 每 的 时 候 , 我 们 多 少 需 上 要 上 出 加 复杂 一 些 的 分 析 , ER O 的 结 
果 是 不 变 的 。 

在 后 面 的 章节 中 , 我 们 将 看 到 递归 的 几 个 淖 亮 的 应 用 。 这 里 , 我 们 还 是 介绍 求解 最 大 于 
序列 和 的 第 四 种 方法 , 该 算法 实现 起 来 要 比 递归 算法 简单 而 日 喝 为 有 效 - 它 在 图 2 8 中 


给 出 
int 
MaxSubsequenceSum( const int AL ], int N3 i 
{ | 


| tnt ThisSum, MaxSum, j: 


f* 1*7 ThisSum = MaxSum = 0; 


f* gy forg j 20: J e N; j++} 
1 
A a i Thissum += AL j ]; 
fe aes iff Thissum > MaxSum jJ 
f* oy MaxSum = This*um: 
f* Br else ifi ThisSum < O } 
fe eee TrisSum = Q: 
| f* 8*/ return MaxSum; 
| } 
图 2-8 算法 4 


不 难 理 解 为 什么 时 间 的 界 是 正确 的 , 但 是 要 明白 为 什么 算法 是 下 兢 吕 行 的 会 费 些 思考 ; 我 
们 把 它 留 给 读者 去 完成 . 该 算法 的 一 个 附带 的 优点 是 , 它 只 对 数据 进行 一 次 扫描 . 一 旦 4[ 被 
读 人 并 被 处 理 , 它 就 不 再 需要 被 记忆 。 因 此， 如 果 数 组 在 磁盘 或 磁带 上 , 它 就 可 以 被 顺序 起 人， 
在 主 存 中 不 必 存 储 数 组 的 什 何 部 分 。 不仅 如 此 , 在 任意 时 刻 , 算法 都 能 对 它 已 经 读 入 的 数据 给 
出 子 序 列 间 题 的 正确 答案 (其 他 算法 不 具有 这 个 特性 )。 只 有 这 种 特性 的 算法 叫做 联机 算法 (or 
line algorithm)。 仅 需要 常量 空间 并 以 线性 时 间 运 行 的 在 线 算法 几乎 是 完 天 的 算法 。 
2.4.4 ”运行 时 间 中 的 对 数 

分 析 算法 最 混乱 的 方面 大 概 集中 在 对 数 上 面 。 我 们 已 经 看 到 ， 某 些 分 治 算法 将 以 O(N 
log N) 时 间 运 行 , 除 分 治 算法 外 ， 可 将 对 数 最 常 出 现 的 规律 概括 为 下 列 -. 般 法 则 :如 果 一 个 工 
法 用 常数 时 间 (Of1)) 将 问题 的 大 小 削减 为 其 一 部 分 (通常 是 172)， 那 么 该 算法 就 是 O(log 
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N)。 另 一 方面 , 如 果 使 用 常数 时 间 只 是 把 问题 减少 一 个 常数 (如 将 问题 减少 1), 那么 这 种 算 
法 就 是 O 〇 O(N) 的 。 

显然 ,只 有 一 些 特殊 种 类 的 问题 才能 够 呈现 出 Oo N) BY, 例如, 车 输入 NN 个 数 , 则 一 个 
算法 只 是 把 这 些 数 评 人 就 必须 耗费 QCN) 的 时 间 其 。 因此 ， 当 我 们 谈 到 这 类 问题 的 Oog N) 算 
法 时 , 通常 部 是 假设 输 和 人 数据 已 经 提前 读 人 -. 我 们 提供 彼 有 对 数 特点 的 王 个 例子 ， 
对 分 查找 

第 一 个 例子 通 贡 吗 做 对 分 查找 (binary search) ; 
对 分 查找 : 

给 定 一 个 整 教义 Bo StH AY, Al, ..., Ax- BE CAMA ER AP, FRE 
A, =X T thi, de X 不 在 数据 中 ， 则 返回 1 二 一 1，; 

明显 的 解法 是 从 堪 到 右 扫 描 数 据 ， 其 运行 花费 线性 时 间 - 然而 , 这 个 算法 没有 用 到 该 表 
己 然 排 学 的 事实 ,这 就 使 得 算法 很 可 能 不 是 最 好 的 。 一 个 好 的 策略 是 验证 X 是 否 是 居中 的 元 
zt. 如果 是 ， 则 答案 就 找到 了 . 如 果 X 小 于 居中 元 素 . 那么 我 们 可 以 庶 用 同样 的 策略 于 居中 
元 素 左 过 已 排序 的 子 序列 ; AA, 如 果 X 大 于 届 中 元 素 , 那么 我 们 检查 数据 的 右 半 部 分 .也 
存在 可 能 会 终止 的 情况 。) 图 2-9 列 出 了 对 分 查找 的 程序 (其 答案 为 Mid)- 图 中 的 程序 反映 了 
CC 语言 数组 下 标 从 0 开始 的 惯例 。 


int 
BinarySearch( const ElementType AL J, ElementType X, int NO 
1 


int Low, Mid, High; 





| fe ity Low = 0; High = N - 1; | 
f* 2*/ whilet Low «= High ) 
{ 
fe gy Mid - € Low + High 3 / ži 
ft 4*/ ifC AL Mid ] < X ) 
Jt 5*7 Low = Mid + 1; 
| else 
| fn 6" ifC AF Mid 1 > X2 | 
f* P High - Mid - 1; 
glse 
/* Bt return Mid; /* Found */ 
] 
/* i return NotFound; /* NotFound is defined as -1 */ | 





图 2.9 对 分 查找 


BR, 每 次 先 代 在 循环 内 的 所 有 工作 花费 为 OC), 因此 分 析 需 要 确定 循环 的 次 数 . RP 
M High — Low = N — 1 开始 并 在 High — Low 2-1 Ro EKE High- Low 的 值 至 
少将 该 次 循环 前 的 值 折 半 ; 于 是 , 循环 的 次 数 最 多 为 [log(N - 1) 1+ 20 (和 例如, £r High 一 
Low — 128, 则 在 各 次 迭代 后 High — Low 的 最 大 值 是 64, 32, 16, 8, 4, 2, 1, 0, -la JA 
此 , 运行 时 间 是 O{leg N)。 等 价 地 , 我 们 也 可 以 写 出 运行 时 间 的 递 推 公式 ,个 过 ， REL ABE: 
解 实际 在 做 什么 以 及 为 什么 这 样 做 的 原理 时 这 种 强行 写 公式 的 做 法 通常 没有 必要 。 

对 分 查找 可 以 看 作 是 我 们 的 第 一 个 数据 结构 实现 方法 , 它 提供 了 在 O Clog NOB 8] P3 89 
Bind( #48 E, 但 是 所 有 其 他 操作 (特别 下 Insert( 插 入 ) 操 作 ) 均 需要 OCN) 时 间 。 在 数据 
是 稳定 ( 即 不 允许 播 人 操作 和 删除 操作 ) 的 应 用 中 ， 这 可 能 是 非常 有 用 的 。 此 时 输 和 人 数据 需要 
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一 次 排 压 . 但 是 此 后 的 访问 会 很 快 , 有 个 例 于 是 一 个 程序 , Eh ER OTE Herh 
CANH RKTL, A ARERIA EH, ASERTITE RIR: 71RA IRE EE 
AR FR. FRARI 110 AR, 因此 找到 一 个 儿 囊 最多 需要 访问 八 次 EEF fr 
TELA ER SVR 
欧 几 里 德 算 法 

第 一 个 例子 是 计算 最 大 会 因数 的 欧 几 里 德 算法 : TS BR AR CC Ged 是 网 时 整 
BEL AAR AKER. FE, Ged (50, 15) - 5. Fd 2-10 中 的 算法 计算 Gel (M,N). RIX 
MIEN. (WRN > M, DIRIA YORI DERE i] SEE 8. 
mH unsigned int | 


Gcd( unsigned tne M, unsigned int N} ; 
1 








unsigned tnt Rem; 


FE 1*/ while( h> 0 3 
i 
/* 2*f Rem - M € M; 
is Be M= Ni 
A 45/4 N = Rem; 
/* SJ return M; 


图 2-10 ESLER 

猎 法 通过 连续 计算 余数 直到 余数 是 和 4 为止, 最 后 的 非 零 余 数 就 是 最 大 公 因 数 . 因此 ， 如 
果 M=1989 和 NM=13590, 则 余数 序列 是 399 , 393,6 , 3, 0, 从而, Ged( 1989, 1590) =3. 
ipn BF Re, 这 是 一 个 快速 算法 

如 前 所 述 , 估计 算法 的 整个 运行 时 间 依 赖 于 确定 余数 序列 究 总 有 多 反 ; ALR log NAW 
理想 中 的 答案 , 但 是 根本 看 不 出 余数 的 值 按照 常数 岗子 递减 的 必然 竹 ， 因 为 我 们 看 人 到 ， 例 中 
的 余数 从 399 仅仅 降 到 393。 事 实 上 ， 在 一 次 近代 中 余数 并 不 按照 一 个 常数 因子 递减 。 FR 
我 们 可 以 证 明 , 在 此 次 迭代 以 后 , 余数 最 多 是 原始 值 的 一 半 。 这 就 证 明了 , 达 代 次 数 至 多 中 
2 log N= Oog N) 从 而 得 到 运行 时 间 ,, 这 个 证 明 并 不 难 ,， 央 此 我 们 将 它 放 在 这 里 , EA 
列 定 理 百 接 排出 。 

定理 2 1 

WEM > N, WM mod N < M/2. 

证 阴 : 

存在 两 种 情形 。 如果 NSM/2, 则 由 于 余数 小 于 N, 故 定 理 在 这 种 情 堪 下 成 立 。 慷 一 种 
情形 是 N > My72。 但 是 此 时 M GUI TN 从 而 余数 为 M- N < M/2, 定理 得 证 。 

从 上 面 的 例 了 来 看 , 2 log N £929 20, 让 我 们 仅 进 行 了 了 次 运算 , 内 此 有 人 会 怀疑 这 是 
不 显 可 能 的 最 好 的 界限 。 事 实 上 , PRC a PC M AN d WT HAE SE HS 
UB gc a e DL HR PT PA RE 1.44log N 欧 几 里 德 算 法 存 平 均 情 况 下 IME ABT E 
at ES hal GC en E ROBE HET. RR ER REY (12 In2 InN) x7 + 1.47; 
diim 

我 人 在 本 节 的 最 后 一 个 例 了 是 处 理 一 个 整数 的 寡 ( 它 还 是 一 个 整数 )。 Hy Be Fe is Hd Fl BY 
Je AAS, 因此, 我们 只 能 在 假设 有 - : 台 机 器 能 够 存储 这 样 一些 大 整数 (或 有 - 
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个 编译 程序 能 够 模拟 它 ? 的 情况 下 进行 我 们 的 分 析 。 我 们 将 用 乘法 的 次 数 作 为 运行 时 间 的 
Hi. 

计算 XN 的 常见 的 算法 是 使 用 N 一 1 次 乘法 自 乘 。 图 2-11 中 的 递归 算法 更 好 。 第 1 行 至 
第 4 行 处 理 基准 情形 。 如 果 N 是 偶数 , 我 们 有 X= XN 人 XN“ SRN 是 奇数 , M XN 
xO-D/2, xiN-I72. X. 


Tong int 
Pow( long int X, unsigned in N ) 
i 


return Powt X * X, N / 2 4; 
else 
return Pow( X * X, N / 2)? * Xj 





图 2-11 高 效率 的 取 寡 运算 


例如 , 为 了 计算 xX? ,算法 将 如 下 进行 , ERAS 9 次 乘法 : 

一 (X*)X, X/— (Gy? X, 下 与 三 (x?) X, Xx 一 (1552 X, x9* = (X?! y 

TR, 所 需要 的 乘法 次 数 最 多 是 2 logN, PROSTETRISUAT AE REA T S RIA (BIR N 左 
奇数 )。 这 里 , 我 们 又 写 出 一 个 递归 公式 并 将 其 解 出 。 简 单 的 直觉 避免 了 盲目 的 强行 处 理 。 

有 时 候 看 一 看 程序 能 够 进行 多 大 的 调整 而 不 影响 其 正确 性 倒是 很 有 意思 的 。 在 图 2-11 
mi 第 3 行 到 第 4 行 实际 上 不 是 必须 的 , 因为 如 果 N 是 1, 那么 第 7 行将 做 回 样 的 事情 。 第 7 
行 还 可 以 写成 

fe Des return Pcw(X, N— 1) * X: 


布 不 影响 程序 的 正确 性 。 事实 上 , 程序 仍 将 以 O(log NET, 因为 乘法 的 序列 辣 以 前 一 样 。 
不 过 , 下 面 拆 有 对 第 5 行 的 修改 都 是 不 可 取 的 , 虽然 它们 看 起 来 似乎 部 正确 : 


/* Bat? return Pow( Pow( X, 2), N / 2); 
/* 6b s/ return Pow( Pow(X, N / 2), 2); 
f* 60*7/ return Pow(X, N /2 ) * Fow(X, NR /2 )i 


6a 和 6b 两 行 都 是 不 正确 的 , 因为 当 N 是 2 的 时 候 递 归 调 用 Pow 中 有 一 个 是 以 2 作为 
第 二 个 参数 。 这样, 程序 产生 一 个 无 限 循环 ， 将 不 能 往 下 进行 (最 终 导致 程序 崩溃 )。 

使 用 Gc 行 影响 程序 的 效率 , 因为 此 时 有 两 个 大 小 为 N /2 的 递归 调用 而 不 是 -… 个 。 分 析 
Buh, 其 运行 时 间 不 再 是 O(log N). 我 们 把 确定 新 的 运行 时 间作 为 练习 留 给 诬 刹 。 
2.4.5 检验 你 的 分 析 

—B GEH US, 则 需要 看 一 看 答案 是 否 正 懈 ， 是 否 尽 可 能 地 好 。 一 种 实现 方法 是 编 
程 并 比较 实际 观察 到 的 运行 时 间 与 通过 分 析 所 描述 的 运行 时 间 是 否 相 匹配 。 当 N 扩大 一 售 
时 ,， 则 线性 程序 的 运行 时 间 乘 以 因 于 2, 一 次 程序 的 运行 时 间 乘 以 因子 4， 而 三 次 程序 则 素 因 
子 8。 以 对 数 时 间 运 行 的 程序 当 N 增加 一 倍 时 其 运行 时 间 只 是 多 加 一 个 常数 ， 击 以 
O(N log N) 运 行 的 程序 则 花费 比 在 相同 环境 下 运行 时 间 的 两 倍 稍 多 一 些 的 时 间 ， an E BY 
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项 的 系数 相对 地 大 ,并 且 N 又 不 是 足够 地 大， Bae TETUR dE RE RE. 例如 ， 
对 于 最 大 子 序列 和 问题 ， 当 从 N =10 增 到 N= 100 时 ,运行 时 问 的 变化 就 是 一 个 例子 . 单纯 
ERR PERM RT FAK AS OCN log N 程序 是 非常 困难 的 。 

验证 一 个 程序 是 否 是 口 (FUND)) 的 另 -- 个 常用 的 技巧 是 对 N 的 甘 个 范围 (通常 用 2 的 倍 
数 障 开 }) 计 算 比 值 TON) / FOND. 其 中 TIN 是 任 经 验 观 察 到 的 运行 时 间 - 如 条 FON) Rim 
行 时 间 的 理想 近似 , 那么 所 算出 的 值 收 僵 于 一 个 正常 数 。 如 果 f(N) 估 计 过 天 , 则 算出 的 值 
Wee 0. 如果 了 FCN) 合计 过 和 低 从 而 程序 不 是 OCFCN)) 的 , 那么 算出 的 值 发 散 。 

作为 一 个 例子 , 图 2- I2 中 的 程序 段 计算 两 个 随机 选取 出 并 小 于 或 等 于 N RESER 
互 素 的 概率 。( 当 N 增 太 时 , 结果 将 趋同 于 6 7 m7.) 









| Rel = 6; Tot = 0; 
for( 1 = 1; 1 <= N; i++ 2 
for( j 2-3 + 1; j <=] N; je 2 
i 
Tote: 
if€ Gecdi i, 3 } == 13 
Rel++; 


| printf( "Percentage of relatively prime pairs is #Pf\n", 
( double ) Rel / Tot 3; 
图 2-12 fa PPTL Ee AE 
污 者 应 该 能 够 立即 对 这 个 程序 做 出 分 析 . 图 2- 13 显示 实际 观察 公 的 该 例 程 在 一 台 具 体 
的 计算 机 上 上 的 运行 时 间 . 该 图 表 指 出 , 表 中 的 万 后 一 列 是 最 有 可 能 的 , 因此 所 得 出 的 这 个 分 
析 很 可 能 正确 . 注意 , 在 ONDA O(NalogN) 之 间 没 有 多 大 差别 .因为 对 数 增长 得 很 慢 。 
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图 2-13 对 上 述 例 程 的 经 验 运 行 时 间 


2.4.6 ”分析 结果 的 准确 性 

经 验 指出 ， 有 时 分 析 会 估计 过 大 如 果 这 种 情况 发 生 , Abe 或 者 需要 分 析 得 更 细 ( 一 般 通过 
机 敏 的 观察 ), 或 者 可 能 是 平均 运行 时 间 显 著 小 于 最 坏 情 形 的 运行 时 间 而 又 不 可 能 对 及 得 的 完 
再 加 以 改进 。 对 于 许多 复杂 的 算法 , 最 坏 的 界 通过 未 个 不 良 输入 是 可 以 达到 的 , 但 在 实践 中 它 
通常 是 估计 过 大 的 , 站 憾 的 是 ,对 于 大 多 数 这 种 问题 ， 平均 情形 的 分 析 是 极其 复杂 的 (在 许多 情 
形 下 还 是 未 解决 的 }, THR RIS EA E 分 悲观 但 却 是 最 好 的 已 知 解析 结 采 。 
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总 结 


ita =L 


KA eT pA RY AO SEES GRU, 它 并 不 是 完善 的 分 析 指 南 。 简 
单 的 程序 通常 给 出 简单 的 分 析 , 但 是 情况 也 并 不 总 是 如 此 。 作 为 一 个 例子 , 在 本 书 稍 后 我 们 
将 看 到 一 个 排序 算法 ( 希 尔 排序 , 第 7 章 ) 和 一 个 保持 不 相交 集 的 算法 (第 8 章 ), 它们 大 约 部 
需要 20 行程 序 代码 。 和 着 尔 排序 (Shelisort) 的 分 析 仍 然 不 完善 ,而 不 相交 集 算 法 分 析 非 常 困 
难 , 需要 许多 页 错综复杂 的 计算 。 不过, 我 们 在 这 里 遂 到 的 大 部 分 的 分 析 才 是 简 单 的 ,它们 
涉及 到 对 循环 的 计数 。 

- .类 有 趣 的 分 析 是 下 看 分 析 , 我 们 尚 术 接触 到 。 在 第 7 章 我 们 将 看 到 这 方面 的 一 个 例子 : 
证 明 尾 何 仅 通过 使 用 比较 来 进行 排序 的 算法 在 最 坏 的 情形 下 只 需要 OON log N) 次 比较 。 下 
界 的 证 明 一 般 是 最 困难 的 ,因为 它们 不 只 适用 求解 其 个 问题 的 一 个 算法 而 是 返 用 求解 该 问题 
的 一 类 算法 。 

在 本 章 结束 前 ,我们 指出 此 处 措 述 的 某 些 算法 在 实际 生活 中 的 应 用 。Gea SOLAR RE 
法 应 用 在 密码 学 中 。 特 别 地 ,200 (HORS RET AMER GA AP 200 位 的 数 ) 
而 在 每 乘 一 次 后 只 有 低 200 位 左右 的 数字 保留 下 来 。 由 于 这 种 计算 需要 处 理 200 位 的 数字 ， 
因此 效率 显然 是 非常 重要 的 。 求 因 运算 的 直接 相 琵 会 需要 大 约 10 吕 次 乘法 ,而 上 面 描 述 的 算 
法 只 需要 大 约 1 200 次 乘法 。 


练习 


2.1 REKREITA: N, VN, NES, N?, N log N, N log log N, N log N， 
N log(N2), 2/N, 2%, 2%”, 37, N'logN, N*, 指出 哪些 函数 以 相同 的 增长 率 增 长 。 
2.2 E TION) E OCFCND f TAN 2 OCF(N))。 下 列 等 式 哪 些 成 并 ? 
a. TI(N)+ TA N}= OCFCN)) 
b. TI(N)— To N)= aC fCN)) 





^ TON) ~ 
d. TI(N)= OCT5(ND)) 
2.3. BRA BECHER LN. log N, 还 是 NT* IN (Ce 0)? 
2.4 ERAXMER HR k, log‘N=o0(N). 
2.5 求 两 个 函数 FON) A gON), 使 得 FUNDA OC KON) R gUNDsE OCF(N)). 
2.6 ”对 于 下 列 六 个 程序 片段 中 的 每 一 个 ; 
a. 给 出 运行 时 间 分 析 ( 使 用 大 OD)» 
b. 用 你 选择 的 程序 语言 编程 ,并 对 N 的 若 于 具体 值 给 出 运行 时 间 。 
c. 用 实际 的 运行 时 间 与 你 所 做 的 分 析 进 行 比较 。 


It Sum = Q; 
for( 1 = 0; 3 « N; itr 2 
SUM++ 5 


(2) Sum = Ü; 
fort 3 = 0; 1 < N; Ite) 
for( j = 0; j < Ni 1€ 3 
ume ; 


i31 Sum = 0; 
forf 120; 7 < N; de 3 
ford j= t; je N~“ N; jee 2) 
SUM ++ ; 


i31 Sum = 05; 
ford i = 0: 3 « N; i++] 
fort j= Ô; jx i; j++ 2 
RUME + ; 
[3t Sum = O; 
for( i= Q; i < Ni ie ) 
fort y= 0: dj <i * i$; je] 
fort k= 0; k « J: k++ 3 
hum, 


lf! Sum = d; 
fort 1 = 1; i < N; d 3 
fort j=l; J « 1 * di Ite) 
ife 3 € i 2-0) 
fort k - 0; k < j; k- } 
Sume+: 


2.7 EREE- BEN N A ARRA — A RELE tA, Pd. 14, 3, 1, 5, 2; 和 i3、1, 4, 2, 


5 就 是 合法 的 置换 , IS, 4, 1, 2. ADE, 因为 数 1 出 现 两 次 而 数 3 ANP. 这 个 


程序 常常 用 于 模拟 - 些 算法 。 我 们 假设 存在 -- 个 随机 数 生成 事 RaudiInt or. j), EV 

相同 的 概率 生成 y 和 7 之 问 的 一 个 整数 . Pme TH: 

b. 如 下 填 人 从 AOIRA ALN -1 的 数组 A ; W TIRA Ali], ERPAT AS B 

ru EE ATO], AL, ， , AL ET LUN, BPÉERIRALAT G1. 

2. IEEE, 但 是 些 保 存 一 个 附 串 的 数组 ,， 称 之 为 Used GAT SB. “STL 
数 Ran 最 初 被 放 人 数组 上 的 时 候 , E Used! Ran = 1. 这 就 起 说 ， 当 用 一 个 随机 
PUAA A[ 门 时 ,可 以 用 一 步 米 测试 是 否 该 随机 数 已 经 被 使 用 ,说 个 是 像 第 -TR 
法 那样 (可 能 ) 进 行 i 步 测试 。 

3. 填写 该 数组 使 得 Ali]=i+5- 然后 : 

forti=1: i N; it 
Swap RA" 1 ], &&. RandInt( 0, i ), ti 


a. 证 明 这 三 个 算法 都 生成 合法 的 置换 ,并 且 所 有 的 置换 者 在 等 可 能 的 ， 
b. 对 每 一 个 算法 给 出 你 能 够 得 到 的 尽 可 能 准确 的 期 望 的 运行 时 间 分 析 ( 几 大 OD. 
c. 分 别 写 出 程序 来 执行 每 个 算法 10 次 , 得 出 一 个 好 的 平均 但 , 对 N = 250, 500, 
1000, 2000 运行 程序 1; 对 N=2500, 5000, 10000. 20000, 40000, 80000 运行 
程序 2; Z N= 10000, 20000, 40000, 80000, 160000, 320000. 640000 运行 程序 3， 
d. 将 实际 的 运行 时 间 与 你 的 分 析 进 行 比较 。 
e. 每 个 算法 的 最 坏 情 形 的 运行 时 间 居 什么 ? 
2.8 用 运行 时 间 的 估计 值 完成 图 2-2 中 的 表 ， 当 叶 这 些 估 计 值 太 长 无 法 模拟 。 插入 这 些 算 
法 的 运行 时 间 并 估计 计算 “上 特 万 个 数 的 最 大 子 序 列 和 所 需 此 的 时 间 . aR AT BE TC 
Ww? 
2.9 计算 P(X) = DIL AX 需要 多 少时 间 ? 
a. 用 简单 的 程序 执行 取 拓 运算 E 
b. EH 2.4.4 PR ABETSE. 
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考虑 下 述 算法 ( 称 为 Horner 法 则 ), 计算 FCX) = DD, AX! 的 值 ; 


Poly = 0; 
for( i = N; 1 >s Qi 1-- D 
Poly = X * Poly + ALi]; 


a. EX =3, F(X) 24X* - 82 - N+ 2 指出 该 算法 的 各 步 是 如 何 进 行 的 。 

b. 解释 该 算法 为 什么 能 够 解决 这 个 问题 。 

c. 该 算法 的 运行 时 间 是 多 少 ? 

给 出 一 个 有 效 的 算法 来 确定 在 整数 AL <A AGS ww. X Ay 的 数组 中 起 天 存在 

整数 ; 使 得 A;= is 你 的 算法 的 运行 时 间 是 多 少 ? 

给 出 有 效 的 算法 (及 其 运行 时 间 分 析 ): 

. 求 最 小 子 序 列 和 ， 

b. 求 最 小 的 正 子 序 列 和 。 

c. 求 最 大 子 序列 乘积 。 

a. 编写 一 个 程序 来 确定 正 整数 N 是 否 是 素数 。 

b. 你 的 程序 在 最 坏 情形 下 的 运行 时 间 是 多 少 ( 用 N 表示 )? (你 应 该 能 够 写 出 O 
G/ N 1) 的 算法 程序 。) 

c. 4 B 等 于 N 的 二 进 制 表示 法 中 的 位 数 。B 的 值 是 多 少 ? 

d. 你 的 程序 在 最 坏 情形 下 的 运行 时 间 是 什么 (用 B 表示 )? 

< 比较 确定 一 个 20( 二 进 制 ) 位 的 数 是 否 是 素数 和 确定 一 个 40{ 二 进 制 ) 位 的 数 是 否 
是 素数 的 运行 时 间 。 

f. 用 w RB 给 出 运行 时 间 更 合理 吗 ? 为 什么 ? 

Erastothenes 得 是 一 种 用 于 计算 小 于 N 的 所 有 素数 的 方法 。 我 们 从 制作 整数 2 到 N 

HEFG, 我 们 找 出 最 小 的 未 被 删除 的 整数 i, 打印 i, 然后 删除 i, 2i, 3i，...。 当 

i >wN it, 算法 终止 . 该 算法 的 运行 时 间 是 包 少 ? 

证 明 X8 可 以 只 用 8 次 乘法 算出 。 

不 用 递归 , 写 出 快速 求 押 的 程序 。 

给 出 用 于 快速 取 寡 运算 中 的 乘法 次 数 的 精确 计数 。( 提 示 : 考 虑 N 的 二 进 制 表 不 ) 

程序 A 和 BB 经 分 析 发 现 其 最 坏 情形 运行 时 间 分 别 不 大 于 150N log; iN AUN? QR HT 

BE. 请 回答 下 列 问题 

a. N 值 很 大 时 (N > 10000), 哪 一 个 程序 的 运行 时 间 有 更 好 的 保障 ? 

b. N 值 很 小 时 (CN < 100), 哪 一 个 程序 的 运行 时 间 更 少 ? 

c. 对 于 N=1000, 哪 一 个 程序 平均 运行 得 更 快 ? 

d. 对 于 所 有 可 能 的 输入 , 程序 B 是 否 总 能 够 比 程序 4 运行 得 更 快 ? 

天 小 为 N 的 数组 A， 其 主要 元 素 是 ~- 个 出 现 次 数 超过 N 72 的 元 素 ( 从 而 这 样 的 元 素 

最 多 有 一 个 )。 例 如, 数组 

3, 3, 4, 2 , 4, 4, 2, 4,4 

有 一 个 主要 元 素 4, 而 数组 

3, 3, 4, 2, 4, 4.2, 4 

没有 主要 元 素 , 如 果 没 有 主要 元 素 , 那么 你 的 程序 应 该 指出 来 。 下 面 是 求解 该 问题 的 
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- -个 算法 的 慨 要 ; 

首先 ， 找 出 主要 元 康 的 一 个 怪 选 元 (这 是 难点 ), 这 个 收入 元 是 惟一 有 可 能 证 主 波 元 
FOLE. 第 二 步 确 定 是 否 该 候选 元 实际 上 就 是 主要 元 素 , 这 正好 是 对 数组 的 顺序 
搜索 。 为 找 出 数组 A 的 一 个 辟 选 元 ,构造 第 二 个 数组 D. 比较 A, e Ads ege) 
We, WR Pes wR P; SMA Re, Ree A, AY, 同样 地 ， 
如 果 它 们 相等 ， 则 取 其 中 之 一 加 到 BP; 否则 什么 也 不 繁 。 以 该 方式 继续 下 去 站 到 
读 完 这 个 的 数组 。 然后, ha PR BP aA, Eee A RI. CA 
+47) 

a. 35 0H Gay x ib? 

b. 34 N 是 奇数 时 ,如 何 处 理 ? 


* c. 该 算法 的 运行 时 间 是 多 少 ? 


d. 我 们 如 何如 人 狗 使 用 附加 数组 B7 


~ a. 编写 一 个 程序 求解 主要 儿 骑 . 


为 什么 在 我 们 的 计算 机 模型 由 假设 整数 具有 岗 定 长 度 是 重要 有 的， 

考虑 第 1 章 中 描述 的 字迹 游戏 问题 , 很 设 我 们 网 定 最 民 单 误 的 大 小 为 10 0E SE. 

a VER, CRW ^r ER E ui PR. RABI TR, 那么 在 第 1 SEDES 
述 的 算法 用 R, CAW 表示 的 运行 时 间 吓 多 少 

设 单词 表 是 预先 排序 过 的 : 指出 如 何 使 用 对 分 查找 得 到 : … 个 这 行 时 间 少 得 多 的 
算法 。 

没 在 对 分 查找 程序 的 第 5 行 的 语句 是 Low = Mid 而 不 是 Low = Mid + 1, iX T fe Hr We fie 
正 情 运行 时 ? 

实现 对 分 查找 使 得 在 每 次 选 代 中 只 有 一 个 一 路 比较 : 

设 算法 3{ 图 2-7) 的 第 6 行 和 第 7 人行 和 


/* 6*/  MaxLeftSum = MaxSubSum( A, Left, Center - 1 ); 
/* 7*/  MaxRightSum = MaxSubSum( A, Center, Right 3 


RE, xx THER IE RE LE et? 

立方 最 大 子 序列 和 算法 的 内 循环 执行 NON 41 DON €2)/6 PORA E IRIS EE INS TH 
应 的 二 次 算法 执行 NON + 1}/2 GER. 而 线性 算法 执行 N WER: ERG UE 
然 的 ? 你 能 给 出 这 种 现象 的 组 合 学 解释 吧 ? 


b. 
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BI 表 、 枝 和 队列 


本 下 讨论 最 简单 和 最 基本 的 一 种 数据 顷 构 “实际 上 , 每 -… 个 有 意义 的 程序 部 将 明晰 地 至 
AiR Rx REZA H. RUT PR ae PR Se HB 不管 你 在 程序 中 是 而 做 本 
WA f arb, 我 们 将 重点 

© 介绍 抽象 数据 类 型 (ADT) 的 概念 

© 阐述 如 何 对 去 进行 有 效 的 操作 . 

e 介绍 栈 ADT A Bm 1 y ET] 

© 介绍 队列 ADT ER FCTETRTE S8 Hit iy H 

A Ar xc dez Pp. EDDA AE AA RE BSL. PR 
"afe. X BE AY PRE ee ESI EB DN X43 di EEBU- RE LITARA A RE 


3.1 抽象 数据 类 型 


ELPA REAR WS -是 例 程 不 点 超过 一 页 .这 订 以 通过 把 程 丰 分 制 为 : 些 模块 
(nodul 来 实现 HEE TE 8 Rr HU TE TESE. 它 通 过 调用 其 他 和 杭 块 让 
全 本 身 保 拉 很 小 ， 模 块 化 有 玫 个 优点 noc. Wep IERRA PIT A E 95. 
PAWEL 个 模块 式 程序 编 释 要 更 穷 易 - 第 一 ， :个 写 得 好 的 模块 化 程序 把 菜 些 依 策 大 
ROAR AE eme, ixMREBHEPDEX ZB SES Pi. 而 要 以 条 种 格式 纲 与 稍 出 ， 直 
双重 要 的 当然 是 让 个 例 程 去 实现 它 ” 如 果 打 型 语 急 分 散在 程 友 各 处 . Bb Ze BR ATU 
Zs AA HES. SURE ARPES AL ta RB RR i A i AR 

Ab $4646 EE (abstract data wpe. ADT) AE E BRE AUR & - i e ce RA Bee re dh 
$i fk ADT AOE CUPRA A ROT SR AE, GA TE RR $e 

Mi, 集合、 AE MAE a AE Re, RR. KAA fi 
MERMA ES HOR SUR A RE A EP BORAT. TI A arc 
们 自己 相关 的 操作 .对 于 集合 ADT, RITA LAARA union), £ intersection). M EKn 
(size) DA de (complernent} VERE , 或者. 我 们 也 可 以 只 要 两 种 操作 : AERIS dA lind), iX 
pa BA HE: TERE A EE XT PA ely ADT 

Fei a A BOA EE LE. BOR ASE EI kB et ft mi 
BTR ADT 上 运行 其 中 的 -ARER TIVA AE Yay es BOR Ty WR re PL AP 
ASEVUBNMHENYB f. 那么 通过 只 修改 运行 这 些 ADT BRE RU BPR SR den Rf 
Ti iM, Pax EA TETI RUSSE m eoo XS OS . 

对 十 每 种 ADT 并 不 存在 什么 法 则 来 告诉 我 们 必须 要 有 哪些 操作 ; xx ET PIT oe 
HGPA IE ALLEE ER Cos B 77) REGE RUE ES RRA A POETS 
这 dE ADT 的 最 基本 的 例子 . 我 们 将 会 看 到 它们 中 的 每 一 种 是 如 何以 多 种 方法 
Ar Ng. dud. 合用 它们 的 程序 却 没有 必要 知道 它们 是 如 何 正 确实 现 胸 


3.2 X ADT 
我 们 将 处 理 -- 般 的 形 如 AS. Ao. Aas ss ABB XE 我 们 说 , 这 个 点 的 大 小 是 N\， 我 
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3 条 3 六 
们 称 大 小 为 0 的 表 为 室 表 (empty list). 

对 于 除 空 表 外 的 任何 表 , 我 们 说 Az. EHE A, CHE A, SAAR A, (Ci < NDBUSR A, 
(i> 1)。 表 中 的 第 -个 元 素 是 A, 而 最 后 一 个 元 素 是 4v、 我 们 将 不 定义 A, 的 前 驱 元 , 也 
不 定义 Ay HEET: JILA A 在 表 中 的 位 置 为 i。 为 了 简单 起 见 , 我 们 在 讨论 中 将 假设 表 中 
的 元 素 是 整数 , 但 一 般 说 来 任意 的 复元 素 也 是 允许 的 。 

与 这 些 “ 定 义 " 相 关 的 是 我 们 要 在 表 ADT 上 进行 的 操作 的 集合 。PrinzList Ml MakeEmpty 
是 常用 的 操作 ,其 功能 显而易见 ; Find 返回 关键 字 首 次 出 现 的 位 置 Insert 和 Delete 一 般 是 
从 表 的 革 个 位 置 插 人 和 删除 某 个 关键 字 ; 而 Find Kth 则 返回 某 个 位 置 上 (作为 套数 而 被 指定 ) 
的 元 素 。 如 果 34, 12, 52, 16, 12 Jé— 1 4. 则 Find (52) 会 返回 3; Insert CX, 3) 可 能 拒 表 
"E34, 12, 52, X, 16, 12( 如 果 我 们 在 给 定位 置 的 后 面 播 人 的 话 ); 而 Delete SIURE 
ty 34. 12, X. 16，12。 

当然 ,一 个 函数 的 功能 怎样 才 算 怡 妆 , 完全 要 由 程序 设计 员 来 确定 ， 就 像 对 特殊 情 次 的 
处 理 那 样 (例如 ,上 上述 Find (1) 返 回 人 村 么 ?)。 我 们 还 可 以 添加 一 些 运算 ,比如 Nert 和 Previ- 
ous ,它们 会 到 一 个 位 置 作为 参数 并 分 别 返 回 其 后 继 元 和 前 豫 元 的 位 置 。 

3.2.1 胡 的 简单 数组 实现 

对 表 的 所 有 操作 都 可 以 通过 使 用 数组 来 实现 。 虽 然 数组 是 动态 指定 的 , 但 是 还 是 需要 对 
表 的 大 小 的 最 大 值 进 行 佑 计 。 通 常 需要 估计 得 大 一 些 , 从 而 会 浪费 大 量 的 空间 。 这 是 产 重 的 
局 限 , 特别 是 在 存在 许多 未 知 大 小 的 表 的 情 次 下 。 

数组 实现 使 得 PrintList 和 Find 正如 所 预期 的 那样 以 线性 时 间 执 行 ,而 FindKeh 则 花 费 常 
数 时 间 。 然 而 , 插 人 和 删除 的 花费 是 昂贵 的 ， 例 如 ,在 位 置 0 的 插入 (这 实际 上 是 做 一 个 新 的 第 
元素) 首先 需要 将 整个 数组 后 移 一 个 位 置 以 空 出 空间 来 ， 而 删除 第 一 个 元 素 则 需要 将 表 中 的 所 有 
元 素 前 移 一 个 位 置 , 因此 这 两 种 操作 的 最 环 情况 为 ON) FHKE, 这 虎 种 运算 都 需要 移动 表 
的 - 半 的 元 素 , 因此 仍然 需要 线性 时 间 。 只 通过 N 次 相继 插 人 来 建立 一 个 表 将 需要 二 次 时 间 。 

因为 插 人 和 删除 的 运行 时 间 是 如 此 的 慢 以 及 表 的 大 小 还 必须 事先 已 知 ， 所 以 简单 数组 一 
艇 不 用 来 实现 表 这 种 结构 。 

3.2.2 链表 

为 了 避免 插 人 和 期 除 的 线性 开销 , 我们 需要 允许 表 可 URE, BURRS 
部 需要 整体 移动 。 图 3-1 表达 了 链表 {linked list) 的 一 般 想法 。 

链表 由 一 系列 不 必 在 内 存 中 相连 的 结构 组 成 。 每 一 个 结构 均 含 有 表 元 素 和 指向 包含 该 元 
素 后 继 元 的 结构 的 指针 。 我 们 称 之 为 Next 指针 。 最 后 一 个 单元 的 Next 指针 指向 NULL; 该 
值 由 C 定义 并 且 不 能 与 其 他 指针 泥 清 。ANSI CC 规定 NULL A. 

我 们 回忆 一 下 ， 指针 变量 就 是 包含 存储 另外 某 个 数据 的 地 址 的 变量 。 因 此 ， mee P Bos 
明 为 指向 一 个 结构 的 指针 , 那么 存储 在 P CPESTECCHCRERON 主 存 中 的 一 个 位 置 ， 在 该 位 置 能 
够 找到 一 个 结构 。 该 结构 的 一 个 域 可 以 通过 PF -> FieldName 访问 ， 其 中 FieldName BRAN 
想 要 考察 的 域 的 名 字 。 图 3-2 指出 图 3-1 中 表 的 具体 表示 。 这 个 表 含 有 五 个 结构 , 恰好 在 内 
存 中 分 配给 它们 的 位 置 分 别 是 1000, 800, 712, 992 和 692。 第 一 个 结构 的 指针 含有 值 800, € 
提供 了 第 二 个 结构 所 在 的 位 置 。 其 余 每 个 结构 也 都 有 一 个 指针 用 于 类 似 的 目的 。 当 然 , 为 了 访 
问 该 老 ,我 们 需要 知道 在 哪里 能 够 找到 第 一 个 单元 。 指针 变量 就 能 够 用 于 这 个 目的 。 ERE 
BE, 一 个 指针 就 是 一 个 数 。 本 章 此 余部 分 我 们 将 用 箭头 画 出 指针 ， 因为 这 样 更 直观 。 
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Teo 800 712 992 692 
[H32 带 有 指针 县 体 值 的 链 去 


AF PA PrinzList( LB Find L, Key), RREH- :个 指针 和 传递 到 该 表 的 第 一 个 元 
Z. SRRIHI— EE Next 指针 穿越 该 表 即 可 .这 种 操作 显然 是 线性 时 间 , A Pe UD BER 
比 用 数组 实现 时 要 大。FindKith 操 基 不 如 数组 实现 的 效率 高 ; FindKih(L , HER OC TTA 
VASE EE Jy ak SPREE A SE EER POR RSP, 因为 调用 FindKih ff WEE FE D 
dE UE tHE. wal. FindKkth( L. 2). FindKth(L. 3). FindKith(L, 4) 004 Findkth(L. 6) 4) 
通过 对 表 的 一 次 扫 揪 同时 实现 . 

删除 命令 可 以 通过 收 改 一 个 指针 来 实现 。 图 3-3 给 出 在 原 表 中 删除 第 一 个 元 素 的 缚 玉 ， 





Bel 3-3 从 链表 中 删除 


插入 命令 需要 使 用 一 次 malloc 调用 从 系统 得 到 一 个 新 单元 (后 而 将 详细 沦 述 ) 并 在 此 所 

执行 两 深 指针 调整 。 其 --- 般 想法 在 图 3-4 中 给 出 ,其 中 的 虚线 表 水 原来 的 指针 。 
| M AS deg Ld a LL l4 
To eA ET 
\ 一 j 
L- ~i 
. 图 3-4 向 链表 插 人 

3.2.3 程序 设计 细 书 

上 面 的 措 述 实际 上 是 以 使 得 - -部 分 都 能 正常 工作 , 但 还 是 有 几 椒 地方 可 能 会 出 问题 。 痛 
此， 并 不 存在 从 所 给 定义 出 发 在 表 的 前 面 插 入 元 素 的 真正 显 性 的 方法 。 第 二 ， 从 表 的 前 面 实 
行 删 除 是 - -个 特殊 情况 , SACE T RIE: 编程 中 的 蚊 忽 将 会 造成 表 的 天 失 。 第 一 
个 问题 涉及 一 般 的 删除 。 昌 然 上 述 指 针 的 移动 很 简单 ， 但 是 删除 算 靶 要 求 我 们 记 作 被 删除 元 
XC MN AIC. 

事实 上 , Rd 个 简单 的 变化 就 能 够 解决 所 有 这 二 个 丫 题 ， 我 们 将 留 出 :个 标志 结 点 ,有 时 
(RRS AA (header) hak 25 (dummy node) 这 是 通常 的 一 种 习惯 , 在 后 面 将 会 多 次 看 到 它 。 我 
(Jane, SAH Ob. 图 35 表示 一 个 带 有 表 头 的 链表 ， EERE A, Ar. -0 As: 

为 洛 免 删除 操作 相关 的 一 些 问 题 ,我 们 需要 编写 例 程 FindPrevious , 它 将 返回 我 们 要 删除 的 
表 雹 的 前 驱 元 的 位 置 。 如 果 我 们 使 用 表 头 ， 那么 当 我 们 删除 表 的 第 -- 个 元 素 时 ，FindPrevious 
PIE A ALLS 头 结 点 的 使 用 多 少 是 有 些 争 议 的 。- - 些 人 认为 ， 添加 假想 的 单元 只 是 为 了 
避免 特殊 情形 ,这样 的 理由 不 够 充足 ; 他们 把 头 铺 点 的 使 用 看 成 与 老式 的 随意 删改 没有 多 大 区 


[43 


44 


S$ 833 


header} 1 Ay | i- ; 
L 


图 3-5 其 有 表 头 的 链表 


24. 不 过 即使 这 样 , 我 们 还 是 在 这 时 使 用 它 , 这 完全 内 为 它 司 我 们 能 够 表达 基本 的 指 竺 操作 用 
区 不 致使 特殊 情形 的 代码 含混 不 清 。 除 此 之 外 , 要 不 要 使 用 表 头 则 龙 属 于 个 人 兴趣 的 问题 。 

作为 例子 ,我 们 将 把 这 些 表 ADT 的 半数 的 例 程 编写 出 来 。 Boo. AR 3-6 中 给 出 我 们 需 
要 的 声明 - PARC MAE, 作为 类 型 的 List( 表 ) 和 Position( 和 位 置 ) 以 及 函数 的 原型 都 刚 在 且 
WEJ h 头 文件 中 。 具 体 的 Node tk S ERME .c XH F. 





| “ifndef iist H 


struct Mode; 


typedef struct Mode *PtrToNode; 
typedef PtrfoNode List, 
typedef PtrToNoade Position; 


List MakeEmpty( List L ); 

int IsEmpty( List L ); 

int IsLast( Position P, List L 3: 

Position Find( ElementType X, List L 5; 

void Delere( Elementtype X, List L 3; 

Position FindPre&vious( ElementType X, List L }; 
void Insert( ElementType X, List L, Position P ); 
void DeleteListt List L 3; 

Position Header( List L 3; 

Position First¢ List L }; 

Position Advance( Position P 3; 

ElementType Retrieve(C Position P }; 


*endi f /* List H */ 


/* Place in the implementation file */ 
struct Node 
i 

ElementType Element; 

Position Next; 


[ 2 4 





图 3-6 链表 的 类 型 声明 


我 们 将 编写 的 第 一 个 函数 是 测试 空 表 的 。 当 我 们 编写 涉及 指针 的 任意 数据 结构 的 代码 
时 ,最 好 总 是 要 先 画 出 一 张 图 来 。 图 3-7 就 表示 一 个 空 表 ; 按照 这 个 图 , 很 容易 写 出 图 3-8 中 
AY PR BL 

KP EER 3-9 PEA, 它 测试 当前 的 元 素 是 可 是 表 的 最 后 一 个 元 素 , 假设 这 个 元 
素 是 存在 的 。 

我 们 要 写 的 下 一 个 例 程 是 Find. Find 在 图 3-10 FRH, Tik E 某 个 元 素 在 岩 中 的 位 
T odis AG Ge e EE HER, BUSTA (ond) ie BIE aden 
部 分 为 假 , 那么 结果 就 自动 为 假 , 而 后 半 部 分 则 不 再 执行 。 E 

有 此 编程 人 员 发 现 递归 地 编写 Find MARMARA, AME 
因为 这 样 可 能 以 免 侈 长 的 终止 条 件 。 后 面 将 看 到 , 这 是 一 个 非常 业 
gne, 我们 要 不 惜 一 切 代价 避免 它 ， 图 3- RANER 
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/* Return true if L is empty ^/ 
int 

FsEmptyr List | ) 

[ 


| | 
| i 
| | 
| 


return c- >Next == NULL: 


Hl 3.8. MRA- “ee dE RITE 


| . - ， , 
”Return true if P is the last position in list L */ 
| f* Parameter | is unused in this implementation “y 


int 
' TsLast{ Position P, List L 3 


| d 
| 1 





return PeoNext == NULL | 


Lo . 





LL. 
图 3.9 ji i da Cr PE ECT GE ERO REB PROC 
m (1 
/* Return Position of X in L; NULL 1f not found */ | 
| ! 
| Position í 
Find( ElementType X, list |. } | 
| 
Positión P; 
fr ly P = L->Next: 
ft 5j whilet P !z NULL && P--Element !- X ] 
f* ay P = FK-»-Mext; 
| fe AEF return P: 


fA 3-10 Find Bg 


第 四 个 例 程 是 删除 表 L 中 的 某 个 元 素 X。 我 们 需要 决定 : 如 果 X MBL PIL KAER 
agen. 那么 我 们 微 什 么 ?我 们 的 例 程 将 删除 第 一 次 出 现 的 和 , 如果 X 不 在 表 中 我 们 就 什 
么 也 不 做 、 为 此 , 我 们 通过 调用 FindPrevious KRGE $i X 的 表 元 的 前 驱 元 P。 实 现 删 除 
GSES ES 3.11 Pet. FindPrevious [np FRE IF Find . TE 3-12 中 到 出 。 


/* Delete First accurrence of X from a list *"/ 
/" Assume use of a header node * 


val d 
Delete( ElementType X, List Lì 


P = FindPrevious( X, L}; 


{fC !Islast( P, L 2 } /* Assumption of header use */ 

{ /* X is found; delete it */ 
TmpCel] - P->Next; 
P-»Next = Tmpcell-sNext; /* Bypass deleted cell “/ 


| | 
' Position P, TmpCell; | 
free( TmpCell 3; 
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m 
地 






/* If X is not found, then Next field of returned */ 
/* Position is NULL */ 
/* Assumes a header */ 









Position 
FindPrevious( Elementiype X, List t ) 
i 


Position P; 







P æL; 
A 2*/ while( P-»Next != NULL && P->Next->Element != X ) 
/* d" P = P-sNext: 


£" 4*/ return P; 


E] 3.12 FindPrevious——— JJ 5j Delete 一 起 使 用 的 Find A 


我 们 要 写 的 最 后 一 个 例 程 是 插入 例 程 。 将 要 插入 的 元 素 与 表 工 和 位 置 了 一 起 传人 。 这 
个 Insert 例 程 将 一 个 元 素 播 人 到 由 下 所 指示 的 位 置 之 后 。 我 们 这 个 决定 有 随意 性 , CERA 
插入 操作 如 何 实现 并 没有 完全 确定 的 规则 。 很 有 可 能 将 新 元 素 插 入 到 位 置 PA EME P 
处 当时 的 元 素 的 前 面 ), 但 是 这 么 做 则 需要 知道 位 置 P 前 面 的 元 素 。 它 可 以 通过 岗 用 Find- 
Previous 而 得 到 。 因 此 重要 的 是 要 说 明 你 要 干什么 。 3-13 完成 这 些 任务 。 


/* Insert (after legal position P) */ 
/* Header implementation assumed */ 
/* Parameter L is unused in this implementation */ 


void 
Insert( ElementType X, List L, Position P ) 


Position TmpCell; 


TmpCell = malloc sizeof( struct Node ) ); 
ift TmpCell == NULL 2 
Fatal!Error( “Out of space!!!" J; 


TmpCell-»Element = X; 
TmpCeli->Next = P--Next; 
P->Next = TmpCelt; 





图 3-13 SERA AE 


注意， 我们 已 经 把 表 工 传递 给 Insert 例 程 和 IsLast WH, 尽管 它 从 未 被 使 用 过 。 之 所 以 
这 么 做 , 是 因为 别 的 实现 方法 可 能 会 需要 这 些 信息 , 因此 , AMER L 有 可 能 使 得 使 用 
ADT 的 想法 失败 ,9 

Ek Find 和 FindPrewious HES (EAA GE Delete , 它 调用 FindPrevious ) . 我 们 已 经 编码 
的 所 有 操作 均 需 O(1) 时 间 。 这 是 因为 在 所 有 的 情况 下 ， 不 管 表 有 多 大 都 只 执行 固定 数 日 的 
指令 。 对 于 例 程 Find 和 FindPrevious, 在 最 坏 的 情形 下 运行 时 间 是 ON), 因为 此 时 若 元 素 


林 找 到 或 位 于 表 的 末尾 出 可 能 遍历 整个 表 。 平 均 来 看 , 运行 时 间 是 ON), 因为 必须 平均 村 
fi FT 
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TE Fg 3-6 中 列 出 的 其 他 例 程 相当 简单 。 我 们 也 可 以 编写 一 个 例 程 来 实现 Previous. BUS 
这 些 将 留 作 练习 : 
3.2.4 常 儿 的 铺 误 

和 过 到 的 错误 是 你 的 程序 因 来 自 系 统 的 琅 手 的 错误 信息 而 朋 深 ， LEi memory access 
violation" EX "segmentation violation "这 种 信息 通常 意味 着 在 指针 变 基 包含 了 伪 地 所 。 一 个 通 党 
PU Re th EB, BD. 如果 图 3-14 中 的 第 Hue. 那么 了 就 是 未 定义 的 , 当然 
也 就 不 可 能 指向 内 仔 的 有 效 部 分 。 另 一 个 典型 的 错误 各 关 于 图 3-13 的 第 6 fr, WR PE 
NULL, 则 指向 是 尺 法 的 .这 个 函数 知道 卫 RAL NULL, 所 以 例 程 没有 问题 ， UA. 你 应 该 
仔细 考虑 . 伍 得 调用 Insert 的 例 程 能 保证 这 一 点 。 无 论 何 时 只 要 你 确定 一 个 指 回 , AL A 
必须 保证 该 指针 不 是 NULL。 有 些 避 编译 器 隐 式 好 为 你 做 这 种 检查 , 不 过 这 并 不 十 忆 标准 的 
一 部 分 。 当 你 将 -个 程序 从 一 个 编译 器 移 至 另 一 个 编译 器 下 时 , a RB ADE FA HIEMS 
行 .这 就 是 这 种 错误 常见 的 原因 之 一 。 








~ — 
| /* Incorrect Deletelist algorithm */ 
void 
| DeleteList{ List L 2 
{ 
| Position P; 
| f* O9) P-21-sNext; /* Header assumed */ 
f™ Qe; L->Next = NULL; 
2 ft 3f while¢ P t= NULL ) 
f 
| f* Atf freet P 3; 
| /* bef P = P->Next; 


I 





图 3-14 删除 一 个 表 的 不 正确 的 方法 


第 二 种 错误 涉及 何 时 使 用 或 何 时 不 使 用 malloc 来 获取 一 个 新 的 单元 。 我 们 必须 记 住 , 声 
明 指向 一 个 结构 的 指针 并 不 创建 该 结构 ,而 只 是 给 出 足够 的 空间 容纳 结构 可 能 会 使 用 的 地 
hk . 创建 尚未 被 声明 过 的 记录 的 惟一 方法 中 使 用 malloc FE Rt. malloc (HowManyBytes) 5f 
Up AHH SE — PRIA. AB, 如 果 你 想 使 用 一 个 指 
针 袜 械 沿 着 一 个 表 行 进 , 那 就 没有 必要 创建 新 的 结构 ; 此 时 不 宜 使 用 malloc 命令 TEH EN 
缩 泽 器 天 要 一 个 类 型 转换 (type cast (TRA PRE IRE a. C 库 提 供 了 malloc 的 其 他 形 
aC. 如 calloc。 这 两 个 例 程 郁 要 求 包含 stdlib.h 头 文 件 。 

当 吉 些 空间 不 再 需要 时 ， 你 可 以 用 free 命令 通知 系统 来 回收 它 。free( 卫 ) 的 结 宁 起: PE 
在 指向 的 地 址 没 变 , 但 在 该 地 址 处 的 数据 此 时 已 无 定义 了 。 

加 果 你 从 未 对 一 个 链表 进行 过 删除 操作 , BB AVAL] malloc 的 次 数 应 该 等 于 表 的 大小 , ES 
有 表 涉 则 再 加 1。 少 一 点 儿 你 就 不 可 能 得 到 一 个 正常 运行 的 程序 ; 多 一 点 儿 你 就 会 浪费 空间 
并 可 能 要 浪费 时 间 。 慢 尔 会 出现 当 你 的 程序 使 用 大 量 空间 时 ， 系统 可 能 不 能 满足 你 对 新 单元 
的 要 求 。 此 时 返回 的 是 NULL 指针 。 

在 链表 中 进行 -一 次 删除 之 后 , 再 将 该 单元 释放 通常 是 一 个 好 的 想法 ， 特别 是 当 存 在 许多 
的 搬 人 大利 出 除 换 杂 在 一 起 而 内 存 会 出 现 问题 的 时 低 。 对 于 要 被 放弃 的 单元 ,应该 需要 The 
take. OUTROS ET LEAR, POR EERSTE 作为 一 个 例子 , 图 3-14 的 代 
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图 3-15 显示 了 删除 工作 的 正确 方法 。 处 理 闲 置 空间 的 工作 未 必 很 快 完成 , 因此 你 可 能 
要 检查 看 是 各 处 理 的 例 程 会 引起 性 能 下 降 ,， 如 果 是 则 要 考虑 周密 。 本 书 作 者 号 了 一 个 程序 
(出 练 导 ) ,通过 对 处 理 空间 (10 000 个 结 点 ) 的 周密 考虑, 该 程序 加 快 了 站 fH. 事实 上 , 单元 
以 相当 特殊 的 顺序 被 释放 ,这 显然 会 引起 另 -- 个 线性 程序 花费 O(N log NAHEA N 个 
单元 。 


/* Correct DeleteList algorithm */ 


void 
Deletelist( List L } 
{ 


Position P, Tmp; 


P = L->Next: /* Header assumed */ 
L-»Mext = HULL; 
while( P !z NULL } 
i 
Imp = P-»MNext; 
free( P 5; 
F = Tmp; 
} 
} 





图 3-15 删除 表 的 正确 方法 

最 后 提 一 个 警告 ;, malloc(sizeof(PtrToNode)) 是 合法 的 , 但 是 它 并 不 给 结构 体 分 配 足 名 
的 空间 。 它 只 给 指针 分 配 一 个 空间 。 
3.2.5 Mek 

有 时 候 以 倒序 扫描 链表 很 方便 。 标 准 实现 方法 此 时 无 能 为 力 ， 然 而 解决 方法 却 很 简单 。 
只 要 在 数据 结构 上 附加 一 个 域 , 使 它 包含 指向 前 一 -个 单元 的 指针 即 可 。 其 开销 是 一 个 附加 的 
链 ， 它 增加 了 空间 的 需求 ,网 时 也 使 得 插 人 和 删除 的 开销 增加 一 倍 , 因为 有 更 多 的 指针 需要 
定位 。 另 一 方面 , 它 简化 了 删除 操作 ,因为 你 不 再 被 迫使 用 一 个 指向 前 驱 元 的 指针 来 访问 - - 
个 关键 字 ; 这 个 信息 是 现成 的 。 图 3-16 表示 一 个 双 链 表 (doubly linked list)» 


RTH THe THETA 
图 3.16 一 个 双向 链表 


3.2.6 TRUER 

让 最 后 的 单元 反 过 来 直 撒 第 一 个 单元 是 一 种 流行 的 做 法 。 它 可 以 有 表 头 ， 也 可 以 没有 表 
HEGER, 则 最 后 的 单元 就 指向 它 )， 并 且 还 可 以 是 双向 链表 (第 一 个 单元 的 前 驱 元 指针 
指向 最 后 的 单元 )。 这 无 疑 会 影响 某 些 测试 ， 不 过 这 各 结构 在 某 些 应 用 程序 中 却 很 流行 。 疝 
3-17 显示 了 一 个 无 表 头 的 双 回 循环 链表 。 





图 3-17 一 个 双向 循环 链表 
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3.2.7 例子 

我 们 提供 三 个 使 用 链表 的 例子 。 第 例 是 表示 一 元 多 项 式 的 简单 方法 ,第 二 例 是 在 某 些 
特 吻 情况 下 以 线性 时 间 壕 行 排序 的 一 种 方法 。 最 后 ,我 们 介绍 个 复杂 的 例子 , 它 说 明了 链 
此 如 何 用 于 大 学 的 课程 注册 . 
多 项 式 ADT 

Teft Tur EA Fi Aokig X- REX: F- UL CRUS EA PORE dm m e SM. m FOX) 
2 NT AX AURA RD RAE, WARTU T (p Y coe n oce ORC ARI 
nae EENET, oR. E. (ROS Hf Be EI ORE bebt, TET TIVA fis HE E 
3-18 中 给 出 的 类 型 声明 。 这 时 , JEf Dt SE RR ERT. EASE ASA 
种 可 能 的 运算 ; 它们 在 图 3-19 到 图 3-21 b xh. ZEE Sait AS But pu], W 
厄 注 例 程 的 运行 时 间 与 两 个 输入 多 项 式 的 次 数 的 习 积 成 正比 ， 它 适合 太 部 分 项 部 有 约 向 沁 和 多 
Rist, Hany PXG — 10x + 5x4 + LH P(X) = 3X9 — 2X4 11X + 5, 那么 
运行 时 间 就 可 能 不 可 接受 了 。 可 以 看 出 ， 大 部 分 的 时 间 都 化 在 了 乘 以 0 和 单 步调 试 两 个 输入 
多 项 式 的 大 量 不 存在 的 部 分 上 上 。 这 备 起 我 们 不 愿 看 到 的 。 


m~~ 
typedef struct 
{ 
int CoeffArray[ MaxDegree + 1 ]; 
int HighPower: 
| * Polynomial; 


| 
L 
图 3.18 ZDA ADT AYSHE EROS ERR US 





















| void 

| ZeroPolynomial( Polynomial Poly ) 

i 

， int i; 

| for( i = 0; i <= MaxDegree; i++ ) 
Poly->CoeffArray{ i ] = à: 

| Poly->HighPower = 0; 

} 


Lo, 
图 3-19 将 多 项 式 初始 化 为 委 的 过 程 
yoid 


AddPolynomial( const Polynomal Polyl, 
const Polynomial Poly2, Polynomial PolySum ) 





| 


| 1 

| int i; 

| ZeroPolynomial( PolySum 3; 

| PolySum->HighPewer = Maxt Polyl-»HàghPower, 

| Poly2-»HighPower }; 

| for( 1 = PolySum->HighPower; 1 >= 0; i-- ) l 

PolySum-»CoeffArray[ i ] = Polyt->CoeffarrayL i ] 

| + Poly2-»CoeffArray[ 1 Y; 

} 


图 3-20 MAE AE 
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void 
MultPolynemial¢ const Polynomial Pelyl1, 

const Polynomial Poly2, Polynomial PolyProd > 
{ 


int i, j; 


ZeroPolynomia'( PoiyProd 3}; 
PolyProd->HighPower = Polyl->HighPower + Poly2->HighPower; 


if( PolyPrad--HighPower > MaxDegree ) 
Error( "Exceeded array size" ); 
else 
for( i = 0; i <= Polyl-»HighPower; i++ ) 
for( j = 0; j <= Poly2-»HighPower; j++ J 
PolyProd->CoeffArray[ i + j ] += 
Polyl-»toeffArray[ i ] * 
Poly2-»CoeffArray[ j l; 


图 3-21 两 个 多 项 式 相 乘 的 过 程 


另 一 种 方法 是 使 用 单 链 表 (singly linked listj。 客 项 式 的 每 一 项 含 在 一 个 单元 中 , JC Hox 
些 单元 以 次 数 递减 的 顺序 排序 。 例 如 , 图 3-22 中 的 链表 表示 P XM P2(X)。 此 时 我 们 可 
以 使 用 图 3-23 的 声明 。 


EE Ee 


P, ” 
[Hed Had He l le 
P” 


图 3-22 两 个 多 项 式 的 链表 表 不 


typedef struct Node *PtrToNode; 
struct Node 


int Coefficient; 

int Exponent; 

PtrToNode Next; 
H 


typedef PrrToNode Polynomial; /* Nodes sorted by exponent =y 
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上 述 的 操作 将 很 容易 实现 。 惟 一 的 潜在 困难 在 于 ， 当 两 个 多 项 式 相 绞 的 时 候 所 得 到 的 多 
项 式 必须 合并 同类 项 。 这 可 以 有 多 种 方法 实现 , 我 们 把 它 留 作 练 习 。 
基数 排序 
使 用 链表 的 第 二 个 例子 叫做 基数 排序 (radix sort), Sak RATER EAEE (card 
sort), 因为 直到 现代 计算 机 出 现 之 前 , 它 一 直 用 于 对 老式 穿孔 卡 的 排序 。 
如 果 我 们 有 N 个 整数 , 范围 从 1 到 M( 或 从 0 到 M - D, 我 们 可 以 利用 这 个 信息 得 到 
B _ -种 快速 的 排序 , m 38 A AE AR (bucket sort). 我 们 留置 一 个 数组 , 称 之 为 Count, RDN 
54| M 并 初始 化 为 零 。 于 是 ， Count 有 M PAI BOM). 开始 时 他 们 都 是 空 的 。 当 A, REA 


hy RPAH 4] 
T] Count A; G1. ÆRA LA BBE HEU. SAFE RE Count, STAT MR ze. E. 
法 花费 OCM + N); EWH BEA. 如 果 M= BCN)， 则 柄 式 排 序 为 OCN). 

基数 排序 是 这 种 方法 的 推广 ， 了 解 方法 含 多 的 最 容易 的 六 式 就 是 举例 说 明 。 设 我 们 有 
10 个 数 , 范围 在 0 到 999 之 问 , 我 们 将 其 排序 。 一 : 般 说 来 , 这 是 0 到 N?- 1 问 的 N TR, p 
是 菜 个 常数 。 显 然 , 我 们 不 能 使 用 桶 式 排 序 , IPE AST. RRB ae et 
排序 。 自 然 的 算法 就 是 通过 最 高 {有效 )" 位 "(村 基数 N 所 取 的 位 ) 进 行 桶 式 排序 , 然后 是 对 
次 最 高 (有 效 ) 位 进行 , 等 等 ， 这 种 算法 不 能 得 出 下风 结果 , 但 是 ,如果 我 们 用 塘 低 {有效 ) 
“位 ?优先 的 方式 进行 桶 式 排序 , 那么 算法 将 得 到 正确 结果 。 当 然 , 有 可 能 多 于 - :个 数落 人 相 
同 的 桶 中 , 但 有 别 于 原始 的 桶 式 排序 . 这 些 数 可 能 不 同 , 因此 我 们 把 它们 放 到 一 个 表 中 。 注 
E. 所 有 的 数 可 能 都 有 某 位 数字 , 因此 如 果 使 用 简单 数组 表示 表 ,， 耶 么 每 个 数组 必然 大 小 为 
N. ARZ ER AE ON). 

F ei IF uH] 10 个 数 的 桶 式 排 序 的 具 蛋 做 法 - 本 例 的 输 人 是 04, 8, 216, 512. 27, 
729, 0, 1, 343, 125( 前 10 个 立方 数 , 随机 排 州 )。 第 - 步 按照 最 低位 优先 进行 桶 式 排序 。 为 
使 问题 简化 , 此 时 操作 按 基 是 10 进行 , 不 过 一 般 并 不 做 这 样 的 假设 。 图 3-24 ah P668 
的 售 罢 ,， 凡 此 按 最 低位 优先 排序 得 到 的 上 去 是 0，1, 512, 343, 64, 125, 216. 27, 8, 729. WE 
再 按照 次 最 低位 { 即 十 位 上 的 数 宇 ?优先 进行 第 -: 趟 排序 ( 凯 图 3-25)。 第 二 趟 排序 输出 0，1， 
8. 512, 216, 125, 27, 729, 343, 64、 现 在 这 个 表 昆 按 两 个 最 小 的 位 排序 得 到 的 表 . 最 后 一 - 
未 彬 式 排 序 是 按 最 高 位 进行 ， 其 结 虹 显示 于 图 3-26, EUREN REO, 1, 8, 27, 64, 125, 


216, 343, 512, 729, 
Po fal sz 
| 0 | 1 2 








图 3-24 第 一 趟 霹 数 排序 后 的 桶 





图 3-25 第 二 趟 基数 排序 后 的 桶 





图 3.26 景 后 -不 某 数 排 序 后 的 捅 


力 使 算法 能 够 得 出 正确 的 结果 , 要 注意 惟一 出 错 的 可 能 是 如 来 两 个 数 出 自 间 -个 桶 但 顺 
序 却 是 错误 的 。 不 过 , 前 面 各 趟 排序 保证 了 当 几 个 数 进 人 一 个 桶 的 时 候 , 它们 是 以 排序 的 顺 
序 进 和 的， 该 排序 的 运行 时 间 是 OCP(N+ B). 其 中 P 是 排序 的 趟 数 ，N 是 要 被 排序 的 元 
索 的 个 数 , 而 BERR. BMP, B= No 





OF 





作为 一 个 例子 , 我 们 可 以 把 能 够 在 (32 位 ) 计 算 机 上 表示 的 所 有 整数 按 基数 排序 方法 排 
序 , 假设 我 们 在 大 小 为 2 的 桶 的 条 件 下 分 三 趟 进行 。 在 这 人 台 计 算 机 上 ， 该 算法 将 总 是 
O(N), 但 是 , 有 可 能 仍然 不 恕 我们 将 在 第 7 章 看 到 的 某 些 算法 有 效 ,， 因 为 包含 大 的 常数 . 
(我 们 记得 , logN 的 因子 不 都 这 么 大 , 而 该 算法 总 有 保存 链表 的 附加 开销 ,) 
L4 E. 

我 们 的 最 后 一 个 例子 阐述 链表 的 更 复杂 的 应 用 。 一 所 有 40 000 名 学 生 和 2 5001 REM 
大 学 需要 生成 两 种 类 型 的 报告 。 第 一 个 报告 列 出 每 个 班 的 注册 者 , 第 二 个 报告 列 出 每 个 学 牛 
注册 的 班级 。 

常用 的 实现 方法 是 使 用 二 维 数组 。 这 样 一 个 数组 将 有 1 亿 项 。 平 均 大 约 一 个 学 后 注册 三 
门 课程 ,因此 实际 上 右 意 义 的 数据 只 有 120 000 项 , A215 0.1%. 

现在 需要 的 是 列 出 每 个 斑 及 每 个 班 所 包 售 的 学 生 的 表 。 我 们 也 需要 每 个 学 生 及 其 所 省 册 
的 班级 的 表 。 图 3-27 显示 实现 的 方法 。 


frente e 


HL d 
cles uy 
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St SE 
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图 3-27 注册 问题 的 多 表 实 现 


正如 该 图 所 显示 的 , 我 们 已 经 把 两 个 表 合 成 为 一 个 表 。 所 有 的 表 都 各 有 一 个 表 头 并 日 都 古 
循环 的 ， 比 如 , 为 了 列 出 C3 班 的 所 有 学 生 , 我 们 从 C3 开始 通过 向 右 行进 而 遍历 其 表 。 第 一 个 
单元 属于 学 生 Si。 虽 然 不 存在 明显 的 信息 . 但 是 可 以 通过 跟踪 该 生 链 表 直 达到 该 表 表 头 而 确定 
该 生 的 信息 。 一 旦 找到 该 生 信息 , 我们 就 转 回 到 C3 的 表 ( 在 遍 厉 该 生 的 表 之 前 ,我 们 存储 了 
我 们 在 课程 表 中 的 位 置 ) 并 找到 可 以 确定 属于 S 的 另外 一 个 单元 ， 我 们 继续 并 发 现 S4 和 SS 
也 在 该 班 F。 对 任意 一 名 学 生 ， 我 们 也 可 以 用 类 似 的 方法 确定 该 生 注 册 的 所 有 识 程 。 

使 用 循环 表 节 省 空间 但 是 要 花费 时 间 。 在 最 坏 的 情况 下 ， 妇 果 第 一 个 学 生 注册 了 每 一 人 
BE, 那么 表 中 的 每 一 项 都 要 检测 以 确定 该 生 的 所 有 诬 程 名 。 因为 在 本 例 中 每 个 学 生 注册 的 
课程 相对 很 少 并 且 每 门 课程 的 注册 学 生 也 很 少 ， 最 坏 的 情况 羡 不 可 能 发 生 的 。 刀 果 怀 疑 会 产 
AE Vaya AK 248 (GE) ATOR BA BBS EARR I e xx fil H A A 
求 加 倍 , 但 是 却 简化 和 加 速 实现 的 过 程 。 

3.2.8 链表 的 游标 实现 
诸如 HASIC 和 FORTRAN 等 许多 语言 部 不 支持 指 针 。 如 果 需 要 链表 而 又 不 能 使 用 指 
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tt. ASA RIETI PRS, FATA BY HT BRA AB (cursor SEALE 

(Ete ARE] LRP A PES 

|. 数据 仓储 在 一 组 结构 体 中 ,每 PRE ARATE IR] e- -个 结构 体 的 措 针 

一 个 新 的 结构 体 避 以 通过 调用 malloc 而 从 系统 全 局 内 存 (globadl memory HS £j. 3E Hf 

通过 调用 free ifn a BER 

游标 法 必须 能 够 模仿 实现 这 两 条 特性 、 满 足 条 件 PRE BE oU BST 
数组 ， 对 于 该 数组 中 的 任何 单元 ， 其 数组 下 栋 可 以 用 来 代表 一 个 地 址 -网 3-28 给 出 链 走 游 
标 实现 的 声明 。 





#1fndef 人 中 


| typedef tnt PtrToNade; 
typedef PtrToNode List; 
typedef PtrTaNode Position; 


void InitializeCursorSpace( void 3; 


List MakeEmpty( List L 3; 

int IsEmpty const List L 3; 

int Istast€ const Position P, const List L ); 
Position Find( ElementType X, const List L 3; 
void Delete( ElementType X, List Lo}; 

Position FindPrevious( ElementType X, const List L ); 
void Insert( ElementType X, List L, Position P 3; 
void DeleteList( List L 3; 

Position Header€ const List L 5; 

Position First( const List L 5; 

Position Advance( const Position P 5; 

ElementType Retrieve( const Position P 3; 


x endi f /* Cursor */ 
/* Place in the implementation file */ 
Struct Node 
ElementType Element; 
i Position Next; 
uH 


struct Mode Cursorspace[ SpaceSize ]; 


图 3.28 链表 游标 实现 的 声明 


现存 我 们 必须 模拟 条 件 2, 让 CursorSpace 数组 中 的 
单据 代行 malloc 和 free 的 职能 。 为 此 ， 我 们 将 保留 一 
表 ( 即 freelist). 这 个 表 由 不 在 任何 表 中 的 单元 铭 成 。 该 
表 将 用 单元 0 作为 表 头 。 其 初始 配置 在 图 3-29 P den. 
对 于 Next, 0 的 值 等 价 于 NULL Feet. CursorSpace 
Ag io f — I RE EST, 我 们 将 它 留 作 练 对 。 
为 执行 malloc 功能 , 将 (在 表 头 后 面 的 ) 第 一 个 元 素 从 
freelist 中 删除 。 为 了 执行 free 功能 , 我 们 将 该 单元 放 在 | 
freelist 的 前 端 。 网 3-30 表示 出 malloc 和 free hi d p 3c 
Qn. noe, 如 果 没有 可 用 空间 , 那么 我 们 的 例 程 通过 置 。 图 $329 PREN Casoria 
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P= 会 正确 地 实现 。 它 表明 再 没有 空间 可 用 ,并 且 也 本 以 便 CursorAlloc 的 第 二 行 成 为 空 
操作 (fno-op) .. 






| static Position 

| CursorAlloc( void ) 
{ 

| Position P; 


P = CursorSpace[ O ].Next; 
CursorSpace[ O ].Next = CursorSpace[ P i.Nexrt: 


return P; 








| } 
static void 
CursarFreet Position P ) 


CursorSpace[ P ].Next = CursorSpace[ 0 ].Next; 
Cursorspace{ O ].Next = P; 


i 


Ej 3-30 BER CursorAlloc 和 CursorFree 


有 了 这 些 , 链表 的 游标 实现 就 简单 了 了。 次 了 前 后 一 致 ， 
我 们 将 用 一 个 头 结 点 实现 我 们 的 链表 。 作 为 一 个 例子 , 在 图 
3.31, mE L 的 值 是 5 而 M 的 值 为 3, W LETEK a, 
b, e, 而 M de tix c, d, fo 

Ay T S o Fate Scot de a oce es E, 我 们 必须 传递 各 
返回 与 指针 实现 时 相同 的 参数 。 这 些 例 程 很 简单 。 图 3-32 是 
一 个 测试 表 是 香 为 空 表 的 函数 。 图 3-33 实现 对 当前 位 置 是 否 
是 表 的 末尾 的 测试 。 图 3-34 中 的 函数 Find 返回 表 工 中 的 下 
的 位 置 。 实 现 删除 的 程序 在 图 3-35 中 给 出 。 再 有 , 游标 实现 
的 接口 和 指针 实现 是 一 样 的 。 最 后 , 图 3-36 表示 Insert WF 
标 实 现 - 


BH 
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13-31 链表 游标 实现 的 例 


/* Return true if L is empty */ 
int 
IsEmpty( List L ) 
{ 
return CurserSpace[ L ].Next == 0; 


} 





图 3.32 ”测试 一 个 链表 是 否 为 空 的 函 救 一 一 游标 实现 


/* Return true if P is the last position in list L afi 
/* Parameter L is unused in this implementation */ 


int 


IsLast( Position P, List L J 


return CursorsSpace[ P ].Next == 0; 


} 





图 3.33 测试 P 是否 是 链表 的 末尾 的 函 歼 一 一 游标 实现 
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/* Return Position of X in Li: O if net found */ 
/* Uses à header node */ | 


Pasition 
Find( ElementType X, List L ) 


| 
| 
| | 
| i 
i Position P; 
| 


fF Ut P = Cursorspace; L ]l.Next; 

f™ 2t/ while( P && CursorSpace[ P ].Element != X } 
| /*5m»/ P = CursorSpace[ P ].Next; 
| /* 4*/ return P; 


3-34 PE Find 





游 怀 实现 





/* Delete first occurrence of X from a list */ 
/* Assume use of a header node */ 


vo1d 
Delete( ElementType X, List L ) 


Position P, TmpCell; 

P = FandPrevaous( X, L 1 

ift !TsLast( P, EL) )  /* Assumption af header use */ 

{ /* X is found; delete jit */ 
TmpCe)] = CursorSpace[ P ]. Next: 


CursorSpace[ P ].Next = CursorSpace[ Tmpce!l ].Next; 
CursorFfree£ Tmpte!l 3, 


! | 


图 3.35 ”对 链表 进行 删除 操作 的 例 程 Delere 一 一 游标 实现 


- — «= —— 





/* Insert (after legal position P) */ 
/* Header implementation assumed */ 
/* Parameter L is unused in this implementation * y 


void 
Inserti Elementiype X, List L, Position P ) 


{ 
Position TmpCell; 


l*/ Tmptell = CursorAlioc( 5; 
f* 2*7 ifi Tmpcell == 0 3 
/* 3*/ FatalError( "Out of space!!!" j; 
f* arf CursorSpace[ TmpCell ].Element = X; 
ft $9j CursorSpace[ TmpCell }.Next = CursorSpace[ P ].Néxt; 
ir 6*/ CursorSpace[ P ].Next = TmpCell; 


in 
* 








图 3.36 对 链表 进行 插 人 操作 的 例 释 [Insert 一 一 游标 实现 


其 祭 个 程 的 编码 类 似 。 关 键 的 一 点 是 , 这 些 例 程 遵循 ADT 的 规范 。 它 们 采用 特定 的 受 
县 并 执行 特定 的 操作 。 实 现 对 用 户 是 透明 的 。 游 标 实现 可 以 用 来 代替 链表 实现 , 实际 上 在 程 
这 的 其 余部 分 不 需要 恋 化 。 由 于 缺少 内 存 管理 例 释 , 因此 , 如 果 运 行 的 Find 函数 相对 很 少 ， 
则 游标 实现 的 速度 会 显著 加 快 。 
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freelist 从 字 面 上 看 表示 一 种 有 趣 的 数据 里 构 。 共 freelist 删除 的 单元 是 刚刚 由 frec 让 在 

那里 的 单元 。 因 此 , 最 后 被 放 在 freelist 的 单元 是 被 最 先 合 走 的 单元 。 有 一 -种 数据 结构 也 兵 有 
CM MEE, MAER (stack), 它 是 下 一 节 要 讨论 的 课题 。 


3.3 $% ADT 


3.3.1 栈 模 型 

栈 (stack) 是 限制 插 人 和 删除 只 能 在 -- 个 位 置 上 进行 的 表 , i, HY 
顶 {top)。 对 栈 的 基本 操作 有 Push( 进 栈 ) 和 Pop HER), 前 者 相当 于 搬入 , 后 者 则 是 删除 最 
后 插 人 的 元 索 。 最 后 插 人 的 元 素 可 以 通过 使 用 Top 例 程 在 执行 Pop 之 前 进行 考查 。 对 空 栈 
进行 的 Pop 或 Top 一 般 被 认为 是 栈 ADT 的 错误 。 田 一 方面 ， 当 运行 Push MASS E 
个 实现 错误 , 但 不 是 ADT 错误 。 S 










Pops) Pushix, 3) 


Fap($) 


图 337 栈 模 型 : 通过 Posh 向 栈 输 入 , 通过 Pop 从 栈 输 出 


栈 有 时 又 叫做 LIFO( 后 进 先 出 ) 表 。 在 图 3-37 
中 描述 的 模型 只 象征 者 Push 是 输入 操作 而 Pop 和 
Top 是 输出 操作 。 普通 的 清空 栈 的 操作 和 判 疡 是 
否 空 栈 的 测试 都 是 栈 的 操作 指令 系统 的 一 部 分 ， 
但 是 , 对 栈 所 能 够 做 的 ,基本 上 也 就 是 Push Fl 
Pop 操作 。 

A] 3.38 表示 在 进行 苦于 操作 后 的 一 个 抽象 的 
栈 。 一 般 的 模型 是 , 存在 某 个 元 素 位 于 栈 顶 , 而 该 
元 素 是 惟 -- 的 可 见 元 素 。 图 3.38 REN: 只 有 栈 顶 元 素 是 可 访问 的 
3.3.2 ROR 

由 于 栈 是 一 个 表 , 因此 任何 实现 表 的 方法 都 能 实现 栈 。 RATATAT A 
法 ,一 种 方法 使 用 指针 , 而 男 一 种 方法 则 使 用 数组 。 但 是 , 正如 我 们 在 前 一 节 和 着 到 的 ,如果 
使 用 好 的 编程 原则 ， 那么 调用 例 程 不 必 知 道 使 用 的 是 哪 种 方法 。 
栈 的 链表 实现 

栈 的 第 一 种 实现 方法 是 使 用 单 链 表 。 我 们 通过 在 表 顶 端 插 人 来 实现 Push, 通过 删除 表 
顶端 元素 实现 Pop. Top 操作 只 是 考查 表 项 端 元 素 并 返回 它 的 值 。 有 时 Pop 操作 和 Top 操 
WESTA- 我们 本 可 以 使 用 前 一 节 的 链表 例 程 , 但 为 了 清楚 起 见 我 们 还 是 从 头 开 始 重 写 栈 
的 例 程 。 

首先 , 我 们 在 图 3-39 中 给 出 一 些 定义 。 实现 栈 要 用 到 一 个 表 头 。 图 3-40 表明 , WAE 

56, 栈 与 测试 空 表 的 方式 相同 。 
(i 创建 -… 个 空 酚 也 很 简单 ,我 们 只 可 建立 一 个 头 结 点 ，MakeEmpty 设置 Neat TESTI 
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#ifndef _Stack_h 


struct Node; | 
typedef struct Node “PtrToNode; 
| typedef PtrToNode Stack: | 








, int IsEmpty( Stack 5 3; 
| Stack CreateStack( void j; l 
void DisposeStack( Stack $ 3}; 
|. void MakeEmptv( Stack 5 3; | 
| void Push( ElementType X, Stack 5 3; 
'  ElementType Top( Stack 5 }; 
void Popi Stack 5 3: 


Sendif v= _Stack_h */ 


/* Stack implementation is a Tinked list with a header ^/ 
struct Node 


| 了 


| /* Place in implementation file */ | 


1 

| ETementType Element; 
PirToNode Next: 

EF 

L au LL | 


图 3-39 H ADT REX SEL 26 RU ps H 


int 
IsEmpty Stack 5 3 


4 


return S->Next == NULL; ; 
| | 
[E 340 测 斌 栈 是 否 空 楼 的 例 程 一 一 链表 实现 
NULLI 3-41), Push. 二 作为 向 链表 前 端 进 行 插 和 人 而 实现 的 ， Hou, AER nm fi y He 
(WE 3-42). Top 的 实施 是 道 过 考查 表 在 第 一 个 位 置 上 的 元 素 而 完成 的 { 见 涛 3-43)。 ER, 
Pop 是 通 过 删除 表 的 前 端的 元 素 fj 3c AD CDL ES 3-44)。 








Stack 
CreateStack( void j 


1 
Stack 5; 


S5 = malloc( sizeof( struct Node ) 3; 
iff 5 == NULL 7 
FatalError{ "Out of space!!!" J; 
| = == NULL: 
MakeEmpty( 5 J; 
return 5; 


F 


void 
MakeEmptyť Stack 5 ) 


if€ 8 == NULL } | 
Errori "Must use CreateStack first" 3; 
else 
while( 'IsEmpty( 5 9 3 
Pant S 3; 





图 3-41 ”创建 一 个 空 栈 的 例 程 一 一 链表 实现 


48 gsx 

















void 
Push( ElementType X, Stack 5 3 
1 


PtrToNode TmpCe!i; 


TmpCell = malloc( sizeof( struct Node ) 5; 
if( TmnCel! == NULL 3 
FatalErrar( “Gut of space!!!" 5; 
else 
{ 
TmpCalt->Elament = X; 
TmpCel}->Next = 5->Next; 
5-»Maxt = TmpCaell: 


图 3-42 Push 进 栈 的 便 程 一 一 链表 实现 


ElementType 
Topt Stack $ ) 
{ 
itt tIsEmpry¢ $ ) 3 


return S-»Next-»Element; 
Error( "Empty stack" ); 
return 0; /* Return value used to avoid warning */ 





[E] 3.43 返回 栈 项 元 素 的 例 程 一 一 链表 实现 


void 
Pop( Stack 5 ) 


PtrToNode FirstCell; 


if( IsEmpty¢ $ 3 3 

Error( "Empty stack" }; 
else 
1 


Firstceil = S->Next; 
S->Next = 5-2Mext--Next; 
free( FirstCelt 3; 


} 
} 





图 3-44 ”从 栈 弹 出 元 素 的 例 程 一 一 链表 实现 


很 清楚 ,所 有 的 操作 均 花 费 常数 时 间 ， 因为 这 些 例 程 没 有 任何 地 方 涉 及 到 栈 的 大 小 ( 空 
栈 除外 ), 更 不 用 说 依 束 于 栈 大 小 的 循环 了 。 这 种 实现 方法 的 缺点 在 于 对 rmalloc 和 free 的 凋 
用 的 开销 是 昂贵 的 , 特别 是 与 指针 操作 的 鲍 程 相 比 尤其 如 此 。 有 的 缺点 通过 使 用 第 一 个 栈 可 
以 避免 , 该 第 二 个 栈 初 始 时 为 空 栈 。 当 一 个 单元 从 第 一 个 栈 弹 由 时 ,， 它 只 是 被 放 到 了 第 二 个 
栈 中 。 此 后 ， 当 第 -- 个 栈 需要 新 的 单元 时 , 它 首先 去 检查 第 二 个 酚 。 
栈 的 数组 实现 

另 一 种 实现 方法 避免 『 指 针 并 且 可 能 是 更 流行 的 解决 方案 。 这 种 策略 的 惟一 潜在 危害 是 
我 们 需要 提前 声明 一 个 数组 的 大 小 。 一 般 说 来 , 这 并 不 是 个 问题 , 因为 在 典型 的 应 用 程序 
中 ， 即 使 有 相当 多 的 栈 操 作 , 在 任 一 时 刻 栈 元 素 的 实际 个 数 从 不 会 太 大 。 声 明 一 个 数组 足够 
大 而 不 至 于 浪费 太 多 的 空间 通常 并 没有 什么 困难 。 如 果 不 能 做 到 这 一 点 ， 那么 节省 的 做 法 是 
使 用 链表 来 实现 。 
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H -个 数组 实现 栈 是 很 简单 的 。 每 -个 本 有 一 个 ToepOfStack. x FERREE- OA 
TEAS RE a HAE). OR SOE PLR X ERA BOR EDD TopOfStack fitt 1, oA 
Stack TopOfStack ! = X. HIP Stach EUR RAEKFRBSSXSH . Ay TR oc a FT] Bk OI 
ULA Stack? TopOfStack IR TopOfStack RY. 当然， t T TE AMA E S PR. A Stack 
数组 利 ToO Stack 是 代表 一 个 栈 的 结构 的 一 部 分 。 使 用 全 局 变量 和 加 定名 字 来 表示 这 种 (或 
任 --) 数 据 结构 几乎 总 是 有 害 的 , AATEA SSCA P BBR ET OTR. ae 
裤 陈 程序 的 时 候 , 你 应该 尽 订 能 紧密 地 遵循 模 由 ,这样 ， 除 一 些 栈 例 程 外 ,你 的 程序 的 任何 
划分 痢 没 有 存 取 被 每 个 栈 列 含 的 数 纪 或 乒 顶 (top-of -stack) 变 量 的 可 能 。 这 对 所 有 的 APT 探 
作 帮 是 成 立 的 ， @ Ada WC- 4 这样 的 现代 程序 设计 调 言 实际 上 都 能 够 实施 这 个 法 则 ， 

注意 , CORRE ALA ET RI 41. ud AE CIE ER AL Gt, CEE AL aE 
A. ATRA GAL SURE EEL BEE. 则 (整数 的 ) Pash 和 Pop 都 可 以 号 成 一 条 
机 器 指 今 . 最 现代 化 的 计算 机 将 栈 操 作 作 为 它 的 指令 系统 的 一 部 分 , 这 个 事实 强化 了 这 性 一 
种 观念 , 即 栈 很 可 能 是 在 计算 机 科学 中 在 数组 之 后 最 基本 的 数据 结构 ， 

-个 影响 栈 的 执行 效率 的 问题 是 错误 检测 。 我 们 的 链表 实现 中 是 仔细 地 检查 错 座 的 ， IE 
du FE PER ES, 对 空 栈 的 Pop 或 是 对 满 栈 的 Push 都 将 超出 数组 的 界限 并 引起 称 序 导语 . 
ab ok, 我 们 订 愿 意 出 现 这 种 情况 。 介 是. 如 哩 把 对 这 些 条 件 的 检测 效 到 数组 实现 过 程 中 . ab 
就 很 可 能 要 花费 像 实 际 栈 操作 那样 多 的 时 间 。 让 于 这 个 原因 , 除非 在 错误 处 理 极其 重要 的 场 
合 { 如 在 操作 系统 中 ) ,一般 在 栈 例 程 中 省 去 错误 检测 就 成 了 普通 的 惯用 于 法 虽然 在 多 数 傅 
况 直 你 可 能 通过 声明 一 个 栈 天 到 不 至 于 使 得 操作 溢出 ,并 保证 使 用 Pop BIERE E S Pop 
- .个 空 栈 而 侥幸 避免 对 错误 的 检测 . 但 是 ,这 充其量 只 不 过 是 使 得 程序 得 以 还 第 运行 而 已 ， 
特别 是 当 程序 很 太 并 且 基 由 不 止 一 个 人 编写 或 是 分 着 十 次 写成 的 时 候 。 因 为 栈 操作 花 党 如 此 
快 的 常数 时 间 ， 所 以 一 个 程序 的 主要 运行 时 间 很 少 会 花 在 这 些 例 程 上 面 。 这 就 意味 首 , AEN 
错误 检测 - -最 是 不 有 要 的 。 你 应 该 随时 编写 错误 检测 的 代码 ; 如 果 它 们 元 长 , 那么 当 它 们 确实 
耗费 太 客 时 间 时 你 总 可 以 将 它们 去 掉 {eomment them out), 在 进行 上 而 的 评述 以 后 . FRAT XN 
在 就 可 以 编写 用 数组 实现 -- 般 的 栈 的 例 程 了 。 

在 图 3.45 中 See( 栈 ) 被 定义 为 指向 一 个 结构 体 的 指针 。 该 线 构 体 包含 TopOfStack W 
Al Capacity 域 。 一 旦 知道 最 大 容量 ， 则 该 楼 即 可 规 动 态 地 确定 。 图 3-46 GUEE NAR EE 
的 最 天 值 的 栈 。 第 3 行 到 第 5 行 指定 该 栈 的 结构 , 而 第 6 行 到 第 8 行 则 指定 乒 的 数组 . 第 9 
行 和 第 10 行 初始 化 域 TopOfStack AUR Capacity. 栈 的 数组 不 需要 初始 化 。 第 11 行 返回 栈 。 

为 了 释放 乒 结构 应 该 编写 例 程 DisposeStack ， 这 个 例 租 首 先 释放 栈 数组 ， 然 后 轰 放 栈 疆 
向 体 ( 兄 图 3-47)。 由 于 CreateStack 在 栈 的 数组 实现 中 需要 一 个 参数 ， 而 在 链表 实现 中 不 需 
发 参数 . 央 此 若 在 后 者 的 实现 中 不 添加 哑 元 的 话 , 那么 这 个 使 用 栈 的 例 程 就 需要 知道 正在 使 
出 的 星 哪 种 实现 方法 。 不幸 的 是 . 效率 和 软件 理想 主义 常常 发 生 冲 突 。 

我 们 已 经 假设 所 有 的 栈 均 处 理 相 同类 型 的 元 素 。 在 许多 的 编程 语言 收 、 如 果 存 在 个 同类 
TE ARE. 那么 我 们 就 需要 为 每 种 不 同类 型 的 栈 重 新 编写 一 食 栈 的 新 的 例 程 .同时 给 每 套 俩 大 
册子 不 同 的 名 字 。 在 C+ + 中 提供 了 更 彻底 的 方法 , 它 允 许 我 们 编写 E ERPE, 对 
任何 类 者 的 栈 部 能 正常 运行 。C+ + 还 允许 儿 种 不 同类 型 的 栈 保留 相同 的 过 程 和 函数 名 ( 刀 
Push KPop), 通过 检验 证 调 例 程 的 类 型 ,编译 程序 可 决定 使 用 哪些 例 程 。 

下 进行 了 上 面 的 六 述 以 后 ,现在 我 们 就 来 重 写 五 个 栈 例 程 。 我 们 将 以 纯 ADT RAEE 
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/*l1*/ 


#afndef  5rack h 


struct StackRecord; 
typedef struct StackRecord *Stack; 


int IsEmpty( Stack 5 3; 

int IsFuli( Stack 5 »; 

Stack CreateStack( int MaxElements }: 
void Bisposestack( Stack 5 >; 

void MakeEmpty( Stack 5 ); 

void Pusht ElementType X, Stack $ J; 
Elementtype Top( Stack 5 3; 

void Pop( Stack S ); 

Element?type TapAndPop( Stack 5 ); 


+#endif  /* Stack h */ 


/* Place in implementatioin file */ 

/* Stack implementation is a dynamically allocated array */ 
xdefine £mptyTOS © -1 1 

#define MinStackSize ( 5 ) 


struct StackRecord 


int Capacity; 
int TopOfStack; 
FlementType *Array; 





图 3-45 REAA- RARA 


Stack 
CreateStack( int MaxElements ) 


Stack 5; 


if( MaxElements < MinStackSize ) 
Error( "Stack size is tac small" 5; 


S = malloc( sizeof( struct StackRecord ) jJ; 
if( S == NULL ) 
FatalError( "Out of space!!!" 5; 


S-»Array = malloc( sizeof( ElementType 3 * MaxElements ); 
iff 5-»Array == NULL } 
FatalError( "Out of space!!!" J; 
&-»Capacity = MaxElements; 
MakeEmpty( S ); 


return 5; 
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woid 
DisposeStack( Stack 5 } 
1 


ifC 5 t= NULL J 


free( S-»Array ); 
free( 5 3; 
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数 和 过 程 的 题名 外 观 等 同 王 链表 实现 。 iE A AS EEE AR, H A Pde 
述 { 见 图 3-48 到 图 3-52). 


int 


IsEmpty{ Stack 5 ) 
í 


return S->TopOGfStack == EmptyTOS; 





i 
| 68 | 
图 3.48 RN — PRE Ss BE Pe A 3c) | | 
L69 | 


void 
MakeEmpty( Stack 5 3 


S->TopofStack = EmptyTOs; 





图 349 GG — RR BD A 


.. _—. 
| void 

Pushé ElementType X, Stack 5 ) 
， 1 

| ift IsFull£ 5 ) ) 





Errori "Full stark" J; 


else 
| S->Array[ ++5->TapOfStack ] = X; 


Po 


图 3-50 进 栈 的 例 程 一 一 数组 实现 





ElementType 
Top( Stack 5 ) 
1 
if( !IsEmpty( $ ) ) 
return 5-»Array[ 5-»TopOfStack J; 
Error( "Empty stack" >; 
return 0; /* Return value used to avoid warning */ 


图 3-51 将 栈 顶 返回 的 例 程 一 一 数组 实现 


void 
Pop( Stack 5 ) 
1 
iff IsEmpty( 5 ) ) 
Errort "Empty stack" J; 
else 


S-»TopOfStack--; 





图 3.52 从 楼 弹出 元 索 的 例 程 一 UB SCR 70 


Pop 偶尔 写成 返回 弹出 的 元 素 ( 并 使 栈 改 变 ) 的 函数 。 虽然 当前 的 想法 是 函数 不 应 该 改变 
其 输入 参数 , 但 是 图 3-53 表明 这 在 中古 最 方便 的 方法 。 


mee 


ee g3* 












Element] ype 
TeopAndPop( Stack 5 ) 
i 





ift !IsEmpty( S 5 ) 
return $-»Array[ $--TopOfStack-- ]: 
Errori "Empty stack" }; 
return 0; /* Return value used to avoid warning */ 


} 


图 3-53. 给 出 栈 顶 元 素 并 从 栈 弹出 的 例 程 一 数组 实现 


33.3 应 用 

BRAG, 如果 我 们 把 操作 限制 于 一 个 表 , 那么 这 些 操作 会 执行 得 很 快 。 然 而 , 令 人 惊 
奇 的 是 , 这 些 少量 的 操作 非常 强大 和 重要 。 在 栈 的 许多 应 用 中 , 我 们 给 出 三 个 例子 ,第 三 个 
实例 深刻 说 明 程序 是 如 何 组 织 的 。 
平衡 符号 

编译 器 检查 你 的 程序 的 语法 错误 , 但 是 常常 出 于 缺少 一 个 符号 (如 遗漏 一 个 花 括号 或 是 
注释 起 始 符 ) 引 起 编译 器 列 出 上 百 行 的 诊断 . 而 真正 的 错误 并 没有 找 出 ， 

在 这 种 情况 下 一 个 有 用 的 工具 就 是 检验 是 否 每 件 事情 都 能 成 对 出 现 的 一 个 程序 。 于 是 ， 
短 一 个 右 花 括 导 、 右 方 括号 及 右 圆 括号 必然 对 应 其 相应 的 左 括号 。 序列“[()]" 是 合法 的 , 但 
“[( ] )" 是 错误 的 。 显然, 不 值得 为 此 编写 一 个 大 型 程序 ,事实 上 检验 这 些 事情 是 很 容易 的 ， 
为 简单 起 见 ， 我 们 仅 就 圆 括号 、 方 括号 和 花 括号 进行 检验 并 忽略 出 现 的 任何 其 他 字符 。 

这 个 简单 的 算法 用 到 一 个 栈 , SEMT: 


做 -一 全 空 栈 。 读 入 字 特 直到 文件 尾 。 如 彬 字符 是 一 个 开放 鞍 号 ， 则 将 其 推 入 找 中 - 
如 果 池 符 是 一 个 封闭 糙 号 ， 则 当 栈 空 时 报错 。 否 则 ， 将 栈 元 素 弹 出 。 如 果 弹 出 的 符号 不 
是 对 应 的 开放 桂 号 ， 则 报错 。 在 文件 是 ,如果 栈 非 空 则 报 钳 。 


你 应 该 能 够 确信 这 个 算法 是 会 正确 运行 的 。 很 清楚 , 它 是 线性 的 , 事实 上 它 只 需 对 箱 八 
进行 一 趟 检验 。 因 此 , 它 是 在 线 (on-line) 的 , 是 相当 快 的 。 当 报错 时 , 决定 如 何 处 理 需要 做 ， 
一 些 附 加 的 工作 一 一 例如 判断 可 能 的 原因 。 

ERRAR 

假 疫 我 们 有 一 个 便携 计算 器 并 想 要 计算 一 趟 外 出 购物 的 花费 。 为 此 , 我 们 将 一 列 数据 相 
加 并 将 结果 乘 以 1.06; 它 是 所 购物 品 的 价格 区 及 附 如 的 地 方 税 。 如 果 购 物 各 项 花 销 为 4.99， 
5.99, $016.99, 那么 输入 这 些 数据 的 自然 的 方式 将 是 

4.99 + 5.99 + 6.99 * 1.06 = 

随 着 计算 器 的 不 同 , 这 个 结果 或 者 是 所 要 的 答案 19.05, 或 者 是 科学 答案 18.39。 最 简单 
的 中 功能 计算 器 将 给 出 第 一 个 答案 , 但 是 许多 先进 的 计算 器 是 知道 滋 法 的 优先 级 是 局 于 加 


法 的 。 
5 HH, 有 些 项 是 需要 上 税 的 而 有 些 项 则 不 是 , 因此 ,如果 只 有 第 一 项 和 最 后 一 项 是 
要 上 税 的 ,那么 


4.99 * 1.06 + 5.99 + 6.99 * 1.06 = 
将 在 科学 计算 器 上 给 出 正确 的 答案 (18.69) 而 在 简单 计算 器 上 给 出 错误 的 答案 (19.37)。 科学 
计算 器 一 般 包含 括号 ， 因 此 我 们 总 可 以 通过 加 括号 的 方法 得 到 正确 的 答案 , BEERA 


(8. TE fe FA SY 


Fae te Bic FE RII 

Pd ds LESS WU RT EA RE 4.90 &1 1.06 FABRE FEY A), PREAH 5.99 ALA, Hn, BE 
TERRE A AQ 我 们 再 将 6.99 f0 1.06 MEIRE A. 最 后 将 A Fi Ao 加 :并 将 最 后 
HEERA Ay. 我们 可 以 将 这 种 操作 咕 序 书写 如 下 : 

4.99 1.06 * 5.99 + 6.99 1.06 * - 

ix ie iA HABES 58 postfix 8 3£ 2 2 (reverse Polish idik. BOR ELJ fx REID 
ü| ren gp. 计算 这 个 问题 最 容易 的 方法 是 使 用 - TEES UA Le TE BU HEAR 
中 ;在 遇 到 - :个 运算 答 时 该 算 符 就 作用 二 从 该 栈 强 出 的 酚 个 阁 ( 符 导 ) pb. YES 
dto (EAD. 后缀 表达 式 

O524 7,8 © + 3a * 
计算 如 下 : APO TE SERRA REP UT FE e 
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"Tasks a 所 以 3 和 2 Aie, 并 是 它 们 的 和 5 REAP. 72; 
— F ee 


| 
|... Topuk MI 3 
| 4s 
dL d 


| TapOrMzck = 8 
| 


PE 
BcWu--4-"u. 因此 8 和 5 弹出 , FHS * 8 = 40 进 栈 : 
AT] 








RR. BG. 


| 
| TDp 总 的 rmek 一 | 
uH 


eae Ba, 央 此 4 各 和 5 被 弹出 , FEL S 1 40 = 45 HER. 


一 下 


TSca ge — d; 
| i 6 
—————— 








现在 将 3 | RARE. 


Ez 


Fa] 


TopOfStack — | 


3 | 
45 | 
6 





然后 ”+ "使 得 3 和 45 从 栈 中 弹出 ,并 将 453 + 3 = 48 EAR, 


TopOfSeack 





最 后 ， 遇 到 一 个 “* ”号 ， 从 楼 中 弹出 48 和 6, 将 结果 6 * 48 = 288 压 进 栈 中 。 





Tüpofsrack 一 


计算 一 个 后 绎 表达 式 花费 的 时 间 是 ON), 因为 对 输入 中 的 每 个 元 素 的 处 理 都 是 由 一 些 
栈 操作 组 成 从 而 花费 常数 时 间 。 该 算法 的 计算 是 非常 简单 的 。 注 意 ， 当 一 个 表达 式 以 后 颁 记 
寻 给 出 时 , 没有 必要 知道 任何 优先 规则 。 xx 3E T 83 EAR 
中 绿 到 后 经 的 转换 

栈 不 仅 可 以 用 来 计算 后 缀 表达 式 的 值 ， 而 且 我 们 还 可 以 用 栈 将 一 个 标准 形式 的 表达 式 
(或 叫做 中 组 式 (infix) ) 转 换 成 后 缀 式 。 我 们 通过 只 人 允许 操作 + ，* ,(，, )， 并 坚持 普通 的 优先 
级 法 则 而 将 一 般 的 问题 浓缩 成 小 规模 的 问题 。 我 们 还 要 进一步 假设 表达 式 是 合法 的 。 设 我 们 

ath#*ct(d*et{f)*g 
转换 成 后 级 表达 式 。 正 确 的 答案 是 

abc * +de*ft+ge* + 

当 读 到 一 个 操作 数 的 时 候 , 立即 把 它 放 到 输出 中 。 操 作 符 不 立即 输出 ， 从 而 必须 先 存 在 
某 个 地 方 。 正确 的 做 法 是 将 已 经 见 到 过 的 操作 符 放 进 栈 中 而 不 是 放 到 输出 中 。 当 遇 到 左 圆 括 
号 时 我 们 也 要 将 其 推 信 栈 中 。 我 们 从 一 个 空 栈 开 始 计算 。 

如 果 见 到 一 个 右 括号 , 那么 就 将 栈 元 素 弹 出 , 将 弹出 的 符号 写 出 直到 我 们 通 到 一 个 (对 
应 的 ) 左 括号 , 但 是 这 个 左 括号 只 被 弹出 , 并 不 输出 。 

如 果 我 们 见 到 任何 其 他 的 符号 (“+",“*”,“(”)， 那么 我 们 从 栈 中 弹出 栈 元 亲 直 到 发 
现 优 先 级 更 低 的 元 素 汐 止 。 有 一 个 例外 : 除非 是 在 处 理 一 个 “)” 的 时 候 , 否则 我 们 绝 不 从 栈 
中 移 走 "("。 对 于 这 种 操作 ,，“ 二 ”的 优先 级 最 低 ， 而 “(" 的 优先 级 最 高 。 当 从 栈 弹 出 元 素 的 工 
作 完 成 后 , 我 们 再 将 操作 符 压 人 栈 中 。 

最 后 ， 如 果 我 们 读 到 输入 的 末尾 ， FRR ICR BU APRESS T, 将 符号 写 到 和 输 


出 中 。 
为 了 理解 这 种 算法 的 运行 机 制 , 我 们 将 把 上 面 的 中 级 表 达 式 转换 成 后 缓 形式。 首先 ，a 
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RIA, FR CR. EX. “+ ”被 读 人 并 被 放 信 栈 中 。 接 着 足 b 读 人 并 流向 输出。 这 
一 -时刻 的 状态 如 下 ， 





+ | ab 
Stack Output 
这 时 “* "号 读 人 入 。 操 作 符 栈 的 栈 顶 元 素 比 "* “的 优先 级 低 , 故 没 有 和 输出, C " 进 栈 ， 接 看 , c 
被 污 人 并 输出 。 至 此 , RITA 


NE 

Stack Output 
后 面 的 符 叶 居 +, EE FR RIAR, 需要 将 "* ”从 栈 弹出 并 放 到 输出 中 ; 弹 
出 栈 中 剩 下 的 “+ "号, 该 算 符 不 比 刚刚 遇 到 的 + "号 优先 级 低 而 是 有 相同 的 优先 级 ; 然后， 
将 刚刚 遇 到 的 “+ "号 压 人 楼 中 。 


十 abe * + 
Stack Output 
下 -个 被 读 到 的 符 续 是 一 个 “(”, 由 于 有 最 高 的 优先 级 , 因此 它 被 放 进 栈 中 。 然 后 , d AE 
输出 。 


{ 
+ | abc*«d i75] 


Stack Output 
继续 进行 ,我 们 又 读 到 一 个 "* ”。 除 非 正 在 处 理 闭 括 导 , 香 则 开 括 号 不 会 从 栈 中 弹出 , 因此 
没有 输出 。 下 一 个 是 e, 它 被 污 人 并 输出 。 


x 


m 
' abc*+de 
stack Output 


再 往 后 读 到 的 符号 是 "+ "。 我 们 将 * “弹出 并 和 输出， 然后 将 “+ EARP RAR, 我 们 读 
到 了 并 输出 . 


中 
Stack Output 


现在 , 我 们 读 到 一 个 “)”, RTE AA CRH, 我 们 将 一 个 “+ 号 箱 出 。 


+ abcttde*f+ | 


Stack Output 


下 面 又 污 到 :一 个 * *”, BEREARI. R g 被 读 入 并 和 输出。 


[a 


r 


?0 eee B3e 





一 -| [a5c*sde | 
Stack Output 
现在 输入 为 空 ， 因 此 我 们 将 栈 中 的 符号 全 部 弹出 并 和 输出 , HIRERE BR 
B 
Stack Output 


与 前 面相 同 ， 这 种 转换 只 需要 OUN) 时 间 并 经 过 一 趟 输入 后 工作 完成 。 我 们 可 以 通过 指 
定 减法 和 加 法 有 相间 的 优先 级 以 及 乘法 和 除法 有 相同 的 优先 级 而 将 减法 和 除法 添加 到 指令 集 
中 去 。 一 种 巧妙 的 想法 是 将 表达 式 "a - b- [Hab — < 一 "而 小 是 转换 成 "abc - - 。 
我 们 的 算法 做 了 正确 的 工作 ,因为 这 些 操 作 符 是 从 左 到 右 结合 的 。 一 般 情 部 未 必 邵 此， 比如 
下 面 的 表达 式 就 是 从 右 到 左 结合 的 : 22 = B= 256, WK P= 64。 我 们 将 把 取 和 宕 运算 添加 
到 指令 集中 的 问题 留 作 练 习 。 
函数 调用 

检测 平衡 符号 的 算法 提供 一 种 实现 函数 调用 的 方法 。 这 里 的 问题 是 ， 当 调用 一 个 新 泪 数 
iH, 主 调 例 程 的 所 有 局 部 变量 需要 由 系统 存储 起 来 ,否则 被 调用 的 新 函数 将 会 覆 次 调用 例 称 
的 变量 。 不 仅 如 此 , 该 主 调 例 程 的 当前 位 置 必须 要 存储 ,以 便 在 新 函数 运行 完 后 知道 向 哪里 
转移 。 这 些 变量 一 般 由 编译 器 指派 给 机 器 的 寄存 器 , 但 存在 某 些 冲 突 ( 通 常 所 有 的 讨 程 都 将 
某 些 变量 指派 给 1 斗 寄存 器 ), 特别 是 涉及 递归 的 时 候 。 该 问题 类 似 于 平衡 符号 的 原因 全 于 ， 
肾 数 调用 和 哨 数 返回 基本 上 类 似 于 开 插 号 和 闭 括 导 , 二 者 想法 是 一 样 的 ; 

当 存 在 函数 调用 的 时 候 , 需要 存储 的 所 有 重要 信息 , 诸如 寄存 器 的 值 (对 应 变量 的 名 子 ) 
种 返回 地 址 ( 它 可 从 程序 计数 器 得 到 ,典型 情况 下 计数 器 就 是 一 个 寄存 器 ) 等 ， 部 要 以 抽象 的 
方式 存在 “一 张 纸 上 ”并 被 置 丁 一 个 堆 (pile) 的 顶部 。 然 后 控制 转移 到 新 函数 ， APR AC EI h 
用 它 的 一 些 值 代替 这 些 寄存 器 。 如 果 它 又 进行 其 他 的 函数 调用 , 那么 它 了 世 遵 循 相间 的 过 程 。 
当 该 函数 要 返回 时 ， 它 查看 堆 (pile} 顶 部 的 那 张 “ 纸 "并 复 震 所 有 的 寄存 器 。 然 后 它 进行 勾 加 
转移 ， 

BR, 所 有 全 部 工作 均 可 由 一 个 栈 来 完成 , 而 这 正 是 在 实现 递归 的 每 一 种 程序 设计 语言 
中 实际 发 生 的 事实 。 所 存储 的 信息 或 称 为 活动 记录 (activation record), Fe HY ALB Bi (stack 
frame)。 在 典型 情况 下 ,需要 做 些微 调整 : 当前 环境 是 由 栈 顶 描述 的 。 因此 , 一 条 返 轩 知名 
就 可 给 出 前 面 的 环境 (不 用 复制 )。 在 实际 计算 机 中 的 栈 常 常 是 从 内 存 分 区 的 高 端 向 下 增长 ， 
而 在 许多 的 系统 中 是 不 检测 汶 出 的 。 由 于 有 太 多 的 同时 在 运行 着 的 函数 ， 用 尽 栈 空间 的 情 六 
总 是 可 能 发 牛 的 。 显 而 易 见 ， 用 尽 栈 空间 常 是 致命 的 错误 。 

在 不 进行 栈 溢出 检测 的 语言 和 系统 中 ,程序 将 会 贿 渡 而 没有 明显 的 说 明 。 在 这 些 系统 
中 ， 当 你 的 栈 太 太 时 会 发 生 一 些 奇 怪 的 事情 ， 因为 它 可 能 触及 到 你 的 程序 部 分 。 这 部 分 也 许 
是 主 程序 ,也许 是 数据 部 分 , 特别 是 当 你 有 大 的 数组 的 时 候 。 如 果 它 撞 进 你 的 程序 , WAE 
REA BER 产生 一 些 无 意义 的 指令 并 在 这 些 指令 被 执行 时 程序 月 演 。 如 果 栈 撞 进 你 的 
数据 ,很 可 能 发 生 的 是 ; 当 你 将 一 些 信息 写 人 你 的 数据 时 ， 这 些 信 息 将 冲 毁 栈 的 信息 一 一 很 
可 能 吡 返回 地 址 一 一 那么 你 的 程序 将 返 回 到 革 个 奇怪 的 地址 上 去 , 从 而 程序 期 误 。 
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da E TEC P Ago YER HB re es RE. AE RET DOSES Ae HIC TEE E CS ETT) 8j 
Hish. SFH, 某 些 完全 合法 并 且 表 商 上 无 再 的 程序 也 可 以 使 你 越 出 栈 空间 。 岗 3-54 
中 的 例 程 打印 eR. TELF AR EE. 实际 上 是 正确 的 。 它 下 背地 处 型 空 表 的 基准 情 
Hi. jf Eg HE qup. WE Re RI, GEA ER, MRK PERE A 
20 000P TCHR, WAARA 3 Tee SIA 20 000 个 活动 记录 的 -个 栈 ， 骨 型 的 情况 是 这 
些 活动 记录 出 于 它们 包含 全 部 信息 商 特 别 谋 大 , 内 此 这 个 程 订 很 可 能 归 越 出 栈 空 间 。《【 如 时 
20 000 个 元 素 还 不 足以 使 程序 前 省 ， 壕 么 可 用 更 大 的 个 数 代替 它 .，) 





/* Bad use of recursion: Printing a linked list */ 
/* No header */ 


vold 
PrintListé List L ? 
i 


| 
Jt l*/ iff L l= NULL 2 


| ft Dey PrintElement( L->Element 3; 
0 4*5 Bef PrintListi L-»Next); 


| m 


图 3-51 ”递归 的 不 当 使 用 : 打印 一 个 链表 


PERERIKA (tail recursion). 是 合用 极端 不 当前 例子 、 员 递归 涉及 在 最 后 一 : 行 
的 递归 调用 。 尾 递归 可 以 通过 将 递归 调用 变 成 goto 语句 并 在 其 前 如 上 对 两 数 每 个 参数 的 赋 
值 语句 而 手工 消除 。 它 模拟 了 递归 调用 , 因为 没有 什么 需要 存储 ; 在 递归 调用 结束 之 后 . 实 
际 上 没有 必要 知道 存储 的 值 。 因此, 我 们 就 可 以 带 着 在 一 次 递归 调 几 中 已 经 用 过 的 那些 作 go 
to 到 函数 的 顶部 。 图 3-55 中 的 程序 显示 网 3-54 的 改进 后 的 程序 。 记 住 , 你 应 该 使 用 更 日 然 
的 while 循环 结构 。 此 处 使 用 goto 是 为 说 明 编 译 器 如 何 请 动 地 去 队 着 归 。 





/* Printing a linked list non-recursively */ 
/* Uses a mechanical translation */ 
/* Mo header */ 


vo d 
PrintLtisti List L > 


1 
| tà 
i 


Printklement( L-»Element 3; 
L = L--Next: 


goto top; 
j | 


13-55 不 用 递归 打印 - -个 表 ; SPR RT SCR AE RAE 22:80 


尾 递 归 的 去 除 是 如 此 地 简单 ,以 八 某 些 编译 器 能 够 自动 地 完成 。 但 是 即使 如 此 ， 最 好 还 
是 你 的 程序 自己 去 除 它 。 

递归 总 能 够 被 彻底 除去 (编译 器 证 在 转变 成 汇编 语言 时 完成 的 ), 但 是 这 么 做 是 相当 元 长 
三 昧 的 。 - 般 方 法 是 要 求 使 用 一 个 栈 ， 而且 仅 当 你 能 够 把 最 低 限 度 的 最 小 值 放 到 栈 .上 时 ， 这 
个 方法 才 值 得 -用 。 我 们 将 不 对 此 做 进一步 的 详细 讨论 ， 只 是 指出 , 虽然 非 递归 程序 一 般 说 


n: 

ifé L != NULL 2 | 
i 
| 
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来 确实 比 等 价 的 递归 程序 要 快 , 但 是 速度 优势 的 代价 却 是 由 于 去 除 递归 而 使 得 程序 清晰 性 变 
得 不 足 。 


3.4 队列 ADT 


像 栈 一 样 ， OF) (queue RAE. SRT, 使 用 队列 时 插入 在 一 端 进行 而 删除 则 在 另 一 问 进 
行 。 
3.4.1 队列 模型 

队列 的 基本 操作 是 Enqueue( ABA), 它 是 在 表 的 末端 (叫做 耻 尾 (rear)) 揪 人 一 个 元 素 , 还 
有 Dequeue (H3 BAD, ACRI EE CR [8 ) E E B F3: CO BAK (front) AC. PA 3-56 显示 一 
个 队列 的 抽象 模型 。 






. Dequeue (Q) Enqueue (Q ,X) 


图 3.56 队列 模型 


3.4.2 队列 的 数组 实现 

期 同 栈 的 情形 一 样 , 对 于 队列 而 言 任何 表 的 实现 都 是 合法 的 。 像 栈 一 样 ， 对 于 每 一 种 操 
(t, 链表 实现 和 数组 实现 都 给 出 快速 的 O(1) 运 行 时 间 。 队 列 的 链表 实现 是 直接 的 ， 留 作 练 
习 。 现 在 我 们 讨论 队列 的 数组 实现 。 

对 于 每 一 个 队列 数据 结构 , 我 们 保留 一 个 数组 Queue[ | 以 及 位 置 Front Al Rear, 它们 代 
表 队 列 的 两 端 。 我 们 还 要 记录 实际 存在 于 队列 中 的 元 素 的 个 数 Sizes 所 有 这 些 信息 是 作为 
个 结构 的 一 部 分 , 除 队 殉 例 程 本 身 外 通常 不 会 有 例 程 直 接 访问 它们 。 下 图 表示 处 于 某 个 中 
间 状 态 的 一 个 队列 。 顺 便 指出 ， 图 中 那些 空白 单元 是 有 着 不 确定 的 值 的 。 特 别 地 , 前 三 个 单 
元 含有 曾经 属于 该 队列 的 元 素 。 


7 


Front 





Rear 





操作 应 该 是 清楚 的 。 为 使 一 个 元 素 X AB, 我 们 让 Size M Rear 增 1, 然后 置 Queue 
[Rear] = 对 。 若 使 一 个 元 素 出 队 , 我 们 置 返 回 值 为 Queue! Front |, Size M 1, 然后 使 Front 
增 1。 也 可 能 有 其 他 的 策略 (将 在 后 面 讨论 )。 现在 论述 错误 的 检测 。 

这 种 实现 存在 一 个 潜在 的 问题 。 经 过 10 次 人 队 后 队列 似乎 是 满 了 ,因为 Rear 现在 是 
10, 而 下 一 次 再 人 队 就 会 是 一 个 不 存在 的 位 置 。 然 而 ， 队列 中 也 许 只 存在 几 个 元 素 , AAA 
干 元 素 可 能 已 经 出 队 了 。 像 栈 一 样 ， 即使 在 有 许多 操作 的 情况 下 队列 也 常常 不 是 很 大 。 

简单 的 解决 方法 是 , 只 要 Front Bt Rear 到 达 数 组 的 尾 端 ， 它 就 又 绕 回 到 开头 。 下 图 显示 
在 某 些 操作 期 间 的 队列 情况 。 这 叫做 循环 数组 (cireular array) 实 现 。 

实现 回 绕 所 需要 的 附加 代码 是 极 小 的 (虽然 它 可 能 使 得 运行 时 间 加 倍 )。 如 果 Front 或 
Rear JE 1 使 得 超越 了 数组 , 那么 其 值 就 要 重 置 为 数组 的 第 一 个 位 置 。 
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T RR TAGS 


MEME 


| rt Kear | 


— Enqueue | ] m 








1 | 4 
| Rear E Front | 
经 过 Enqueue(3)hi 
BpID ifr) 


R Front | 一 一 一 
LL | | 80 





经 过 Dequeue 并 返回 2 后 








I M 
经 过 Dequeue J]3R [Bl 1 IA 


TT BIS 


i “ 1 
Rear 
Front 


经 过 Dequeue 并 返回 3 GRIME ASA 


Rear Front 


关于 队列 的 循环 实现 , 有 两 件 事情 要 警 起 。 第 一 , 检测 队列 是 舍 为 裤 是 很 重要 的 ,办 为 
当 队 列 为 空 时 一 次 Dequeue 操作 将 不 知 不 觉 地 返回 一 个 不 确定 的 值 。 第 二, AER Bor A 
员 使 用 不 同 的 方法 来 表示 队列 的 队 头 和 队 尾 。 例 如 ,， 有些 人 并 不 用 一 个 单元 来 表示 队列 的 大 
小 , 因为 他 们 依靠 的 是 基 淮 : WP. 即 当 队列 为 空 时 Rear = Front — 1。 队 列 的 大 小 十 通过 比 
较 Rear 和 Front 隐 式 算出 的 . ise -种 非常 隐秘 的 方法 ,因为 存在 某 些 特殊 的 情形 , 因此 ， 
如 果 你 需要 修改 用 这 种 方式 编写 的 代 公 , BARRERA. RAIA ADR A 
一 -部 分 , 那么 车 数组 的 大 小 为 ASize ， MTE Du - 工 个 无 素 时 队列 就 满 了 ,因为 只 有 有 
ASize 个 不 同 的 大 小 值 可 被 区 分 , Tm O A 是 其 中 的 一 个 。 采 用 任意 -种 你 喜欢 的 风格 , fH SER 
保 你 的 所 有 例 程 都 是 - 致 的 。 ha 因此 如 果 你 不 使 用 表示 大 小 的 域 ， 
那 就 很 可 能 有 必要 进行 一 些 讨 论 ， 否 则 会 在 一 个 程序 中 使 用 两 种 选择 。 M, 

在 保证 Engueue 的 次 数 不 会 大 于 队列 的 大 小 的 应 用 中 , (EFI SEAR ASR f& TX — 
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Fe, 除非 主 调 例 程 肯 定 队 列 非 空 ， 奉 则 Degueue 很 少 执行 。 因 此 对 这 入 操作 ， 只 要 不 是 关键 
的 代码 ， 错 误 的 调用 常常 被 路 过 。 一 般 说 来 这 并 不 是 无 可 非议 的 ,内 为 你 可 能 得 到 的 时 间 节 
省 量 是 极 小 的 。 

我 们 通过 编写 某 些 队列 的 例 程 来 结束 本 节 , 其 余 例 程 留 作 练习 。 肯 先 , 在 图 3-57 中 给 出 
队列 的 声明 。 正 如 对 于 栈 的 数组 实现 所 做 的 那样 ,我 们 添加 一 个 最 大 大 小 的 域 。 还 需要 提供 
GFE CreateQueue 和 DisposeQueue。 此 外 ， 我 们 壕 要 提供 测试 一 个 队列 是 否 为 空 的 例 程 以 及 
构造 一 个 空 队 列 的 例 程 (图 3-58 和 图 3-59)。 读 者 可 以 编写 图 数 ISFull , 它 完 成 其 名 字 所 指出 
的 功能 。 注 意 ，Rear 在 Front 之 前 预 初始 化 为 [1。 我 们 将 要 编写 的 最 后 的 操作 是 Enqueue 例 
积 、 严 格 遵 循 上 面 的 描述 ,我 们 在 图 3-60 得 到 队列 的 数组 实现 。 


ifndef Queue h 
struct QueueRecard; 
typedef struct QueueRecord “Queue; 


int IsEmpty( Queue Q ); 

int IsFull( Queue à 3; 

Queue CreateQueue( int MaxElements 5; 
void DispaseQueue( Queue Q 2; 

void MakeEmpty( Queue Q 9; 

void £naueue( ElementType X, Queue Q ); 
ElementType Fronti Queue Q >; 

void Dequeue( Queue Q ); 

ElemaentType FrontAndDequeuet Queue Q ); 
















#endif /* Queue h */ 


/* Place in implementation file */ 
/* Queue implementation is a dynamically allacated array */ 
define MinQueueSize ( 5 ) 


struct QueueRecord 
1 . 
int Capacity: 
int Front; 
int Rear; 
int Size: 
ElementType *Array; 


图 3-57 队列 的 类 型 声明 


int 
TsEmpty{ Queue Q } 
{ 


return Q-»5ize == 0; 





图 3-58 ”测试 队列 是 否 为 空 的 例 程 一 一 数组 实现 


void 
MakeEmpty( Queue Q > 
{ 


Qq-»5ize = Ü; 
Q-»Front = 1; 
Q-»Rear = 0; 


] 





图 3-59 构造 空 队 全 的 例 程 一 一 数组 实现 


A, GOES 





, Static 1 








nt | 


Succé ant Value, Queue Q 3 


| ifc 


++Value == Q-»Lapacity } 
Value - D; 


| return Value; 
1 


void 
Enqueuet 


afe 


else 
; 


ElementType X, Queue Q } 
isFullé GQ? 3 


Error( "Full queue" J; 


Q--517284—; 
Qü--Rear = Suce( Q->Rear, Q 3: 
Q-»Array[ Q-»Rear ] = X; 


| 
| 
| 
| 
— | 





图 3.60 ”入 内 的 例 程 一 一 数组 实现 


3.43 队列 的 应 用 


有 几 种 合用 队列 给 出 所 高 运行 效率 的 算法 、 它 们 当中 有 些 可 以 在 图 论 中 找到 , 我 们 将 在 


第 9 章 讨 论 它 们 。 这 里 ， 先 给 出 某 些 
当 作 业 送 交 给 一 台 行 式 打 印 机 


Iu HBA P BITE 
, 它们 就 按司 到 达 的 顺 厅 被 排 询 起 来 。 因 此, 被 送 往 行 式 


打印 机 的 作业 基本 上 是 被 战 到 - 个 队列 di s 
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另 一 个 例子 是 关于 计算 机 网 络 的 。 有 许多 种 PC PLI POS ERE, 其 中 磁盘 是 放 人 在 一 合 本 
做 六 件 服务 器 的 机 器 上 的 。 使 用 其 他 计算 宙 的 用 户 是 按照 先 到 先 使 用 的 原则 访问 文件 的 ,内 


Ih BOE AE TBA ; 


OA ASTER RIS ARIF BUSH. 对 大 公司 的 传呼 ARE AAE . 

。 在 大 规模 的 大 学 里 , 如 虹 所 有 的 终端 都 被 占用 ,由 于 资源 有 限 , 学 生 们 必须 在 一 
SEES, 在 终端 上 呆 得 时 间 最 长 的 学 生 将 首先 被 强制 离开 , 而 等 待 时 间 最 长 的 
学 生 则 将 是 下 … 个 被 允许 使 用 终端 的 用 户 、 

椒 理 用 概率 的 广 法 计算 用 户 排队 预计 等 待 时 间 、 等 待 服务 的 队列 能 够 排 多 长 , 以 及 其 他 

:此 诸如 此 类 的 问题 将 用 到 被 称 为 排队 论 4queucing theory) 的 整个 数学 分 支 - ol BA SKK 
赖 寺 - 用 户 加 入 队列 的 频率 以 及 -- 旦 上 用户 得 到 服务 时 处 理 服 务 花 费 的 上 时间: 这 两 个 参数 作为 巾 
率 分 布 函 数 给 出 。 在 一 些 简单 的 情况 下 , 答案 可 以 解析 算出 - ARRATE- RH ER 


有 — BEZEL. GSR RRER DATE, TEE 


fx) uv BA BEB SR 88 AP GRIE RE RU SS 


大 限度 有 关 )。 这 个 问题 在 商业 上 很 重要 ， AAR, Af ARE Lil. 


WERE TERK, 那么 这 个 问题 解决 起 来 要 困难 得 多 。 解析 求解 出 难 的 问题 往 件 
Bie FY -个 队列 来 进行 模拟 。 如 果 必 很 大 , 那么 我 们 过 


使 用 模拟 的 方法 求解 。 此 时， 我 们 需 


-我们 说 基本 上 是 因为 必 亚 可 以 祝 除 去 .这 


等 于 从 队列 的 中 和 进行 的 一 次 删除 , 它 违 把 了 忠烈 的 关 销 证 艾 


85 
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需要 其 他 一 些 数 据 结 构 来 使 得 模拟 里 有 效 地 进行 。 在 第 6 章 将 会 看 到 模拟 是 如 何 进行 的 。 那 
时 我 们 将 对 * 的 若干 秆 进行 模拟 并 选择 能 够 给 出 合理 等 待 时 间 的 最 小 的 &。 

正如 栈 一 样 ,队列 还 有 其 他 丰富 的 用 途 , 这 样 一 种 简单 的 数据 结构 竞 然 能 够 如 此 重要 ， 
LS AM S 
Be 


本 章 描述 了 一 些 ADT HRAS, HEAHEA ae BH (ADT) BGR FT 
概念 。 主 要 目的 就 是 将 抽象 数据 类 型 的 具体 实现 与 它们 的 功能 分 开 。 程 序 必须 知道 操作 都 做 
些 什 么 , 但 是 如 果 不 知 道 如 何 去 做 实际 上 更 好 。 

表 、 栈 和 队 州 或许 在 全 部 订 [ 算 机 科学 中 是 三 个 基本 的 数据 结构 , 大 量 的 例子 证 明了 它们 
广泛 的 用 途 。 特 别 地 , 我 们 看 到 栈 是 如 何 用 来 记录 过 程 和 函数 调用 的 ， 以 及 递归 实际 上 荐 如 
何 实现 的 。 理 解 这 些 过 程 是 非常 重要 的 , 其 原因 不 只 因为 它 使 得 过 程 语言 成 为 可 能 ,而 且 还 
因为 知道 递归 的 实现 从 而 消除 了 围绕 其 使 用 的 大 量 谜团 。 虽 然 递归 非常 强大 , EEFDE 
完全 随意 的 操作 ; 递归 的 误 用 和 乱用 可 能 导致 程序 崩溃 。 


练习 


3.1 编写 打印 出 一 个 单 链表 的 所 有 元 素 的 程序 。 

3.2 ”给 你 一 个 链表 上 和 另 一 个 链表 卫 , 它们 包含 以 升序 排列 的 整数 。 操 作 PrintLots(L, P) 
将 打印 L 中 那些 由 P 所 指定 的 位 置 上 的 元 素 。 例 如 , SUR p = 1, 3, 4, 6, 那么 ,二 中 
的 第 1、 第 3. 第 4 和 第 6 个 元 袁 镍 打印 出 来 。 He PrintLots( 工 ，P}。 你 应 该 只 使 
用 基本 的 表 操 作 。 该 过 程 的 运行 时 间 是 多 少 ” 

3.3 通过 只 调整 指针 (而 不 是 数据 ) 来 交换 两 个 相 邻 的 元 素 , 使 用 
a. 单 链表 。 
b. 双 链 表 。 

3.4 给 定 两 个 已 排序 的 表 L, TR Lo, HIEFHACEBUSEEETEUSTES. LN La 的 过 程 。 

3.5 给 定 两 个 已 排序 的 表 工 ; 和 工 ;， 只 使 用 基本 的 表 操 作 编写 计算 Li UL 的 过 不。 

36 编写 将 两 个 多 项 式 相 加 的 函数 。 不 要 虎 坏 输 人 数据 。 用 一 个 链表 实现 。 如 果 这 两 个 多 
项 式 分 别 有 M 项 和 项 , 那么 你 的 程序 的 时 间 复 杂 度 是 多 少 ? 

3.7 编写 一 个 函数 将 两 个 多 项 式 相 乘 ， 用 一 个 链表 实现 。 你 必须 保证 输出 的 多 项 式 按 寡 次 
排列 并 皇 最 多 有 一 项 为 任意 舌 。 
a. 给 出 以 OOM2N?) 时 间 求 解 该 问题 的 算法 。 

eb. 编写 一 个 以 OCM2N) 时 间 执行 乘法 的 程序 ， 其 中 M. 是 具有 较 少 项 数 的 多 项 式 的 
项 数 。 
e 编写 一 个 以 DLUMN log (MN)) 时 间 执 行 飞 法 的 程序 。 

d. 上 面 哪个 的 时 间 界 最 好 ? 

3 8 编写 一 个 程序 , 输入 一 个 多 项 式 F(X), 计算 出 (F(X))"。 你 的 程序 的 时 间 复 芍 度 是 
多 少 ? 至 少 再 提出 一 种 对 FOOR P 的 某 些 可 能 的 选择 具有 竞争 性 的 解法 。 

19 编写 任意 精度 整数 运算 包 。 要 使 用 类 似 于 多 项 式 运算 的 方法 。 计 算 在 2400 内 数字 0 到 
9 的 分 布 。 
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3.10 Josephus 问题 是 下 面 的 游戏 : N AM 1 BIN 465. 围 坐 成 一个 国 圈 ， 信 1 Hee 
递 一 个 热土 下 -经 讨 M ORR S BALM ARR, GSS OR, di 
坐 在 被 清除 的 人 后 面 的 人 拿 起 热土 豆 继 续 进 行 游戏 ”最 后 剩 下 的 人 取胜 。 因 此 ， 如果 
M — 0 fü N = 5, WRK, 5 号 获胜 . WEM = 1 HEN = 5, 那么 被 清除 
的 人 的 顺序 是 2, 4, 1, 5. 
a. 编写 一 个 程序 解决 M ALN 在 一 般 值 下 的 Josephus 问题 ,应 使 你 的 程序 尽 可 能 地 高 
效 ,要 确保 能 够 清除 单元 。 
b. (RAAB Bier iS] ee be 
c. WE M = 1, 你 的 程序 的 运行 时 间 是 多 少 ? 对 于 大 的 NON 2 10 000). 其 free 例 
程 是 如 何 影响 实际 速度 的 ? 
.11 编写 查找 :一 个 单 链表 特定 元 素 的 程序 。 分 别 用 递归 各 韭 递 册 方 法 实现 , 并 比较 它们 的 
运行 时 间 。 链 表 必 须 达 到 多 大 才能 使 得 使 用 递归 的 程序 册 尝 ? 
3.12 a. 编写 一 个 非 递归 过 程 以 O (NOB BLUE IgE 
b, 使 用 常数 附加 空间 编写 一 个 过 程 以 O(N) 时间 反 转 单 链 胡 。 
13 ”利用 社会 安全 续 公 对 学 生 记 菏 构 成 的 数组 排序 。 编 写 一 个 程序 进行 这 件 工作 , 使 内 内 
4j 1000 RSE HEE Ar = BATT. 


T 


T 


3.14 ”编写 一 个 程序 将 一 个 图 读 人 邻接 表 . 使 用 
a. 链表 
b. 游标 


3.15 a. 写 出 自 调整 (self-adjusting) 表 的 数组 实现 。 自 调整 表 如 同 -- 个 规则 的 表 , 但 让 所 有 
的 插入 部 在 表 头 进行 ， 当 一 个 元 素 被 Find 访问 时 , ERC EER RA MIF AR EA 
余 的 项 的 相对 顺序 . 
- b. 写 出 自 调整 表 的 链表 实现 。 
sc. 设 每 个 元 素 都 有 其 被 访问 的 固定 概率 po 证 明 那 些 具 有 最 高 访问 概率 的 元 素 部 天 
XC. 
6 ”假设 我 们 有 -- 个 基于 数组 的 表 A “0..N 一 11. 并 且 我 们 想 要 删除 所 有 相同 的 多 系 . 


Cl 


LastPosition 初始 值 为 N - 1, 但 该 值 随 着 相同 元 素 被 删除 而 变 得 越 米 越 小 考虑 图 |86. 


3.61 中 的 伪 码 程序 段 。 过 程 Delete 删除 位 置 } 上 的 元 素 并 使 表 破 坏 ; 





/* M for( i =; d < LastPosition; i++} 


fr 2*6 j= i+ 1; 
y* 3 whilef j < LastPosition ) 
fe 4f if¢ AL i ] == ALG 1 2 


else 


f* Be itt: 
} 


P el 


ft i Delete( 13; 


图 3-61 从 表 中 有 删除 重 元 素 的 例 程 一 iG 


a. 解释 该 过 程 是 如 何 进行 工作 的 。 
b， 利 用 一 般 的 表 操 作 重 瑟 这 个 过 程 。 
“如 用 标准 的 数组 实现 , 则 这 个 过 程 的 运行 时 间 是 多 少 ? 


| 88 | 
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d. 使 用 链表 实现 的 运行 时 间 是 多 少 ? 
*e. 给 出 一 个 算法 以 OCGN log N MNT Bi fg te in , 
xe f. TES: 如 果 只 使 用 比较 , 那么 解决 该 问题 的 任何 算法 部 需要 ON. logN) 次 比较 ， 
(提示 : GUS 7.) 
*g. WEB]: 如 果 我 们 允许 除 比 较 之 外 的 其 他 操作 ,并且 这 些 关 键 学 部 是 实数 ， 那 么 我 们 ] 
不 用 元 素 间 的 比较 就 可 以 解决 该 问题 。 
3.17 不 同 于 我 们 己 经 结 出 的 删除 方法, 另 —REBUBETRIER Cozy deletion ) 的 方法 ,为 了 
删除 一 个 元 素 , 我 们 只 标记 上 该 元 素 被 删除 ! 使 用 一 个 附加 的 位 (bit) 域 )。 表 中 被 删 阶 
和 非 被 删除 元 素 的 个 数 作为 数据 结构 的 一 部 分 被 保留 。 如 末 被 删除 元 素 和 非 被 删除 抱 
AFE, 我 们 追 历 束 个 表 , 对 所 有 被 标记 的 节点 执行 标准 的 删除 算法 ， 
a. 列 出 懒惰 删除 的 优点 和 缺点 。 
b. 编写 实现 使 用 懒惰 删除 的 标准 链表 操作 的 例 程 。 
3.18 用 下 列 语言 编写 检测 平衡 符号 的 程序 : 
a. Pascal (begin Zend , C). | 上 于， 
b.C(e* *^,O€Q, D]. ib) 
x Cc, 解释 如 何 打印 出 错 信 息 、 
3.19 编写 一 个 程序 计算 后 缀 表达 式 的 值 。 
3.20 a. 编写 一 个 程序 将 中 绥 圾 达 式 转换 成 后 缀 表达 式 ,， APR RIAM TNC ，+ ， 
"UU "和 “A 
b. 把 寡 操 作 符 添加 到 你 的 指令 系统 中 去 。 
c. EMER GRAY AREA SL 
121 RET BL SA RR, BREA 8E— T REC DERE, 否则 你 的 
Tte FEAR BER Qi HA FS HR. 
3.22 «a. 提出 支持 栈 的 Push 和 Pop 操作 以 及 第 二 种 操作 FindMin 的 数据 结构 , 其 中 FindMin 
返回 该 数据 结构 的 最 小 元 素 ,， 所 有 操作 在 最 坏 的 情况 下 的 运行 时 间 都 是 OL). 
xb. 证明， 如 果 我 们 吉 和 第 四 种 操作 DetereMin， 那 么 至 少 有 一 种 操作 必须 化 费 
QUN, FE, DeleteMin 找 出 并 删除 最 小 的 元 素 。( 本 题 需要 阅读 第 7 36) 
*3.23 说 明 如 何 用 一 个 数组 实现 三 个 楼 : 
3.24 在 2.4 节 中 用 于 计算 翡 波 那 契 数 的 递归 例 程 如 果 在 N = 5 下 和 运行， 栈 空 间 有 本 能 用 
完 妈 ?为 什么 ? 
3.25 ”编写 实现 队列 的 例 程 , 使 用 
a. 链表 
b. 数组 


3.26 XU BAFI (deque) t B — 282 的 表 组 成 的 数据 结构 ， 对 该 数据 结构 可 VAUuttI T ARE : 


Push(X, D): 将 项 六 插入 到 双 端 队列 DD BIRDA o 
Pop(D): MS BA 9j D FP aM ER: Bu 3650274 FEF Ha [E] 
Inject (X, D): 将 项 X fé A SIL BAS D B EE H o 
ject (D) ; BoDORSEA Y] D 中 月 除 尾 端 硕 并 将 其 返回 。 
编写 支持 双 端 队列 的 例 程 , 每 种 操作 均 花 费 O(1) 时 间 。 
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对 于 大 虽 的 输入 数据 , 链表 的 线性 访问 时 间 太 慢 ， 不 宜 使 用 ， 本 章 我 们 介绍 一 种 简单 的 
数据 结构 ,其 大 部 分 操作 的 运行 时 间 平 均 为 Oog N)。 我 们 还 鉴 简 述 对 这 和 促 数据 结构 在 概 
念 上 的 简单 的 修改 , 它 保 证 了 在 最 坏 情形 下 的 上 述 时 间 界 。 此 外 . 还 讨论 了 第 种 修改 ,对 
于 长 的 指令 序列 它 对 每 种 操作 的 运行 时 间 基本 上 是 O(log N): 

茂 们 涉及 到 的 这 种 数据 结构 叫做 二 丸 查 找 树 {binary search treej。 在 计算 机 科 尝 中 树 


"了解 峙 是 如 何 用 于 实现 几 个 流行 的 操作 系统 中 的 文件 系统 的 。 

"” 夏 到 树 如 何 能 够 用 来 计算 算术 衣 达 式 的 值 . 

。 指出 如 何 利用 树 交 持 以 O(NogN) 平 均 时 间 进 行 的 各 种 搜索 操作 ,以 及 如 何 细 化 以 得 到 
最 坏 情 况 时 间 禾 OClog NO, 我 们 还 将 讨论 当 数 据 被 存 齐 碟 盘 上 时 划 休 来 实现 这 些 操 作 


4.1 预备 知识 


宰 {trce) 吕 以 用 上 儿 种 方式 定义 。 定义 树 的 -种 自然 的 方式 是 递归 的 方法 。 一 避 树 是 一 些 
节点 的 集合 。 这 个 集合 可 以 是 空 集 ; 若非 空 , WERT HR Coot PETS XA, r ARO PR 


多 个 非 空 的 (了 ) 树 T. T;..... TAR, 这 些 子 树 路 每 一 棵 的 根 者 被 来 自 根 x RA 
AJA (edge) PTE tE o 


fi TARA ABI AGR > 的 儿子 (child), 而 r AR OPA AR X paren. [E 4-1 
显示 用 递归 定义 的 典型 的 树 ; 


rol 





M441 一 般 的 树 


从 递归 定义 中 我 们 发 现 , 一 棵 树 是 N 个 节点 和 AN - 1 条 边 的 集合 ,其 中 的 一 个 节点 是 
做 根 ， 存 在 N - 1 条 边 的 结论 是 由 下 面 的 事实 得 出 的 , 得 条 边 帮 将 某 个 节点 连接 到 尼 的 信 
Xe, 而 除去 根 生 点 外 每 一 个 节点 都 有 一 个 父亲 ( 见 图 4-2) 


图 4-2 一 棵 具体 的 树 
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在 图 4-2 的 树 中 ,节点 ARR. 而 点 下 有 一 个 父亲 态 并 日 有 儿子 KK、L 和 和 M， 每 一 个 市 
点 可 以 有 任意 多 个 儿子 , 也 可 能 是 零 个 儿子 ,没有 上 几 了 于 的 节点 称 为 树叶 {leaf); 上 图 中 的 树叶 
是 B.C、 HV I, P、Q、K、L、M 和 N。 共 有 相同 父亲 的 节点 为 兄弟 (sibling); 因此 , K, LA 
M 部 是 兄弟 。 用 类 似 的 方法 可 以 定 光 祖父 {grandparent) 和 和 孙子 (grandchild) 关 系 。 

从 节点 n, 到 n, 的 路 径 (path] 定 义 为 节点 ni, nos sss on 的 一 个 序列 ,使 得 对 于 1 SiR, 
节点 n 是 m4 1 的 父亲 。 这 个 路 径 的 长 (length) 为 该 路 径 上 的 边 的 条 数 , 即 有 一 1。 从 每 一 个 节点 
到 它 自己 有 一 条 长 为 0 的 路 径 。 注 意 , 在 一 棵 树 中 从 根 到 每 个 节点 恰好 存在 一 条 路 径 - 

对 任意 节点 n, on; 的 深度 (depth) 为 从 根 到 n 的 惟一 路 径 的 长 。 因 此 , 根 的 深度 为 0。 
n: 的 高 (height) 是 从 n: 到 一 片 树叶 的 最 长 路 径 的 长 。 因 此 所 有 的 树叶 的 高 都 是 0。 一 标 树 的 
高 等 于 它 的 和 根 的 高 。 对 于 图 A2 WOM, E 的 深度 为 1 而 高 为 2; 了 的 深度 为 1 而 高 也 是 1; 
沪 树 的 高 为 3。 一 个 树 的 深度 等 于 它 的 最 深 的 树叶 的 深度 ; 该 深度 总 是 等 于 这 棵 树 的 高 。 

如 果 存 在 从 n, 到 n; 的 一 条 路 径 , 那么 ni AE on; 的 一 位 祖先 (ancestor) 而 22 是 s, 的 一 
A. & & (descendant). WM ny ono, 那么 ny 是 n Wf KAA (proper ancestor) ii n2 是 n 
Ki—“> 4.48 & (proper descendant} e 
4.1.1 树 的 实现 

实现 树 的 一 种 方法 可 以 是 在 每 一 个 节点 除数 据 外 还 要 有 一 些 指针 ,使 得 该 节点 的 每 一 个 

"go 儿子 都 有 一 个 指针 指向 它 。 然 而 ， 由 于 每 个 节点 的 儿子 数 可 以 变化 很 大 并 且 事 先 不 知道 , A 
M 此 在 数据 结构 中 建立 到 各 儿子 节点 直接 的 链接 是 不 可 行 的 ， 因为 这 样 会 产生 太 包 的 浪费 衬 

间 。 实 际 上 解法 很 简单 : 将 每 个 节点 的 所 有 儿子 都 放 在 树 节点 的 链表 中 。 图 4 3 FH RIFS BRA, 
是 典型 的 声明 。 


typedef struct TreeNode *PtrToNode; 


struct TreeNode 


EtementType Element; 

PrrToNode FirstChild; 

FtrToNode NextSibling; 
} 





图 4-3 树 的 节点 声明 


图 4 .4 显示 一 栋 树 可 以 用 这 种 实现 方法 襄 示 出 来 。 图 中 向 下 的 箭头 是 指向 FirstChild( 第 
一 所 子 ) 的 指针 。 从 左 到 右 的 箭头 是 指向 NextSibling( 下 一 兄弟 ) 的 指针 。 因 为 空 指 针 太 多 ， 
所 以 没有 把 它们 画 出 。 





图 44 在 图 4 2 中 所 表示 的 树 的 第 一 儿子 /下 “兄弟 的 表示 法 
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在 图 4-4 的 树 中 , 节点 上 有 一 个 指针 指向 兄弟 (PE)， 另 一 指针 指 癌 儿子 (IT)， 面 有 的 节点 
这 黄种 指针 都 没有 。 
4.1.2 树 的 遍历 及 应 用 

树 有 很 多 应 用 。 流 行 的 用 法 之 一 是 包括 UNIX. VAX/VMS 和 DOS 在 内 的 许多 常用 棵 
作 系 统 中 的 目录 结构 。 图 4-5 是 UNIX 文件 系统 中 一 个 典型 的 目录 。 


"uar" 
=A T 


一 一 一 -一 


一 一 一 一 一 -一 
markt alex* bi^ 
一 ~ 
book* Colr&e* — junk e quake — work" course“ 

2 M | 
chls  chlr chads — copasao cop3212* 
——— 

eT TT 
falia” — sprOT* — sum97* fallas fau 


| -一 


^. 7 
ay Lt «yl.r sr gades — preg!t — progir prez2r proglar — grades 
图 4-5 UNIX Air 


KPARM BE As. 《名 字 后 面 的 星 号 指出 “Ausr A ERE EE Bose sr f — TL 
T: mark, alex 和 bi， 它们 自已 也 都 是 目录 。 因 此 ,“Asr (LE — T Hom HE ELSE 
件 。 文 件 各 "AusrAmarkAbookAchl.r" 先 后 三 次 通过 最 左边 的 儿子 节点 而 得 到 。 在 第 一 个 “A 
后 的 每 个 “A "都 表示 一 条 边 ; 缚 时 为 一 全 路 径 名 。 这 个 分 级 文件 系统 非常 流行 AW ine 
使 得 用 户 光 辑 地 组 织 数 据 。 不 仪 如 此 , 在 不 同 目 录 下 的 棒 个 文件 还 可 以 学 有 相同 的 名 字 . A 
为 它们 必然 有 从 根 开始 的 不 同 的 路 径 从 而 具有 不 同 的 路 径 名 。 存 UNIX 文件 系统 中 的 日 孙 
就 是 含有 它 的 所 有 儿子 的 -- 个 交 件 , 因此 , 这 些 日 录 几 乎 是 完全 按照 KIREGA! es BELA] E 
KE 事实 上 上 ,如果 将 打印 一 个 文件 的 标准 命令 应 用 到 一 个 日 录 . 上 , BARA CP BUR 
文件 名 能 够 在 (与 其 他 非 ASCII 信息 一 起 的 ) 输 出 中 被 看 到 。 

设 我 们 想 要 列 出 目录 中 所 有 文件 的 名 字 。 我 们 的 输出 格式 将 是 : 深度 为 d 的 文件 的 多 
字 将 被 d 次 跳 格 (tab) 缩 进 后 打印 出 来 。 该 算法 在 图 4-6 中 给 出 - 


static void 
ListDirt DirectoryOrFile D, int Depth ) 





if( D is a legitimate entry ) 


{ 
/* Ij PrintName( D, Depth 5; 
/* 3*/ ifC D is a directory > 
/* anf for each child, C, of D 
/* 5*/ Listir C, Depth — 2 3; 
} 
[ t 
| void 


ListDirectory( DirectoryOrFile D > 


ListDir( D. O }; 


} 





4.6 列 出 分 级 文件 系统 中 目录 的 例 程 





二 EUN 文件 系统 中 每 个 目录 还 有 一 项 指向 该 目录 本 身 以 及 另 SGREERHORRUAE HG. TM, PEG iE 
UNIX X fd SR dH, EAA (ireelike). 
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算法 的 核心 为 递归 过 程 ListDir。 为 了 显示 根 时 不 进行 缩 进 , 该 例 程 需要 从 目录 名 和 和 深度 
0 开始 。 这 里 的 深度 是 一 个 内 部 敌 记 变量 , 而 不 是 主 调 例 程 能 够 期 望 知道 的 那 种 参数 。 因 
此 ， 驱动 例 程 ListDirectory 用 于 将 递归 例 程 和 奸 界 连接 起 来 。 

算法 逐 辑 简单 易 懂 。ListDir 的 参数 是 到 树 中 的 某 种 引用 。 只 要 引用 合理 , 则 引用 涉及 的 
名 字 在 进行 适当 次 数 的 跳 格 缩 进 后 被 打印 出 来 。 如 果 是 一 个 目录 , 那么 我 们 递归 地 一 个 一 个 
地 处 理 它 所 有 的 此 子 。 这 些 儿 子 处 在 一 个 深度 上 , 因此 需要 缩 进 一 段 附加 的 空格 。 整 个 输出 
在 图 4.7 中 表示 。 


course 
cop3212 
fal196 


grades 
progi.r 
prog2.r 
fall97 
prog2.r 
progl.r 
grades 





图 4-7 Eo CHOSE 


这 种 遍历 的 策略 叫做 先 序 遍历 (preorder traversal)。 在 先 序 浪 历 中 ,对 节点 的 处 理工 作 是 在 
它 的 诸 儿 子 节 点 被 处 理 之 前 (pre) 进 行 的 。 当 该 程序 运行 时 , 显然 第 二 行 对 每 个 节点 恰好 执行 一 
Xx. 关 为 每 个 名 字 只 输出 一 次 。 由 于 第 2 行 对 每 个 节点 最 多 执行 一 次 , 因此 第 3 行 也 必须 对 每 
个 站 点 执行 一 次 。 不 仅 如 此 , 对 于 每 个 节点 的 每 一 个 儿子 节点 第 5 行 最 多 只 能 被 执行 一 次 。 不 
过 ,儿子 的 个 数 怡 好 比 节点 的 个 数 少 1。 最 后 , 第 5 行 每 执行 一 次 , for FEA MRK, #5 “S48 
环 结 束 时 再 加 上 一 次 。 每 个 for 循环 终止 在 NULL 指针 上 ， 但 每 个 节点 最 多 有 一 个 这 样 的 指针 。 
因此 ,每 个 节点 总 的 工作 量 是 常数 。 如 果 有 NN 个 文件 名 需要 输出 ， 则 运行 时 间 就 是 OLN ): 

另 一 种 遍历 树 的 方法 是 后 序 遍 历 (postorder traversal) 。 在 后 序 遍 历 中 , 在 一 个 节点 处 的 
工作 是 在 它 的 诸 儿 子 节点 被 计算 后 (post) 进 行 的 。 例 如 , 图 4-8 表示 的 是 与 前 面相 同 的 目录 
结构 ,其 中 图 括号 内 的 数 代表 每 个 文件 占用 的 磁盘 区 块 (disk bliock) 的 个 数 。 

由 于 目录 本 身 也 是 文件 , 因此 它们 也 有 大 小 。 设 我 们 想 要 计算 被 该 树 所 有 文件 占用 的 硫 
盘 块 的 总 数 。 最 自然 的 做 法 是 找 出 含 于 子 目 录 ” /usr/mark( 30)", " /usr/alex(9 ) #1“ /usr/bill 
(32)" 的 块 的 个 数 。 于 基 , 磁盘 块 的 总 数 就 是 子 目录 中 的 块 的 总 数 471 ) 加 上 “musr "使 用 的 一 
个 块 , 共 了 2 个 块 。 图 4-9 中 的 图 数 SizeDirectory 实现 这 种 遍历 策略 。 
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一 一 -六 一 
mark *, LY alex. pii*t li 
一 一 一 
book *r1) course *( p? akció junk) work "( 1) caurse*r ri 
Md 7. 
chl r(3) ch? rit ch} 4). cop3530* ly capizlz* t 
- i -. 一 MM 
E4195" (1 spr97"(ListimQ7* 3} failB6*i 1a TG? 1) 
| — NIMM —— qp 
splatly syl) sd 2) grades¢3) prog] rid] progZ rili prog? zt2! prag] r(7) gradesc?? 
入 4-8 eR RUSSIA A TEXAS Unix Hor 
static void 
SizeDirectary( DirectoryOrFile D ) ' 
{ 
int TotalSize; 
1 
/* 1*/ TotalSize = D; 
ft 2*/ if€ D is a legitimate entry ) 
{ i 
/* 3*/ TatalSize = FileSize( BD); 
ft 4%/ iff D is a directory } 
A 5*f for each child, C, of D | 
/* 6*f TotalSize += SizeDirectory( C J); | 
} i 
return TotalStze; 
图 4-9 AT ERAAI | 94 | 


i DAB—T A, 那么 SizeDirectory Aik lA] D Brit BRR Bil, g D SAR 
ode D B E REPRE T TAOID CL CUR ko 9T KIEA aa SR a TRE 
略 之 问 的 不 同 , 图 4-10 显示 每 个 日 录 或 文件 的 大 小 号 如 何 由 该 算法 产生 芍 。 
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E 4-10 A% SizeDirectory 的 轨迹 
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42 二 又 树 


— SUBE (binary tree) 是 一 梯 树 , 其 中 每 个 节点 部 不 能 有 多 于 丙 个 的 儿子 。 
图 4-11 显示 一 棵 由 一 个 根 和 两 棵 子 树 组 成 的 二 多 树 ， 厂 和 和 Tr 均 可 能 为 空 


J 


图 4-11 —fÉ XH 


二 义 树 的 一 个 性 质量 平均 二 丸 树 的 深度 这 比 N 小 得 多 ， 
这 个 性 质 有 时 很 重要 。 分 析 表 明 , 这 个 平均 深度 为 OG ND, 
而 对 于 特 味 类 增 的 二 六 树 , EA EFA (binary search tree), 
其 深度 的 平均 值 是 O(log N). THRE, EAR 4-12 中 的 
例子 所 示 , 这 个 深度 是 可 以 大 到 NN 一 1 的 。 

4.2,1 实现 

因为 -- 标 二 丸 树 最 多 有 两 个 儿子 ,所 以 我 们 可 以 用 指针 
直接 指向 它们 。 树 节点 的 声明 在 结构 上 类 似 于 双 链 表 的 声明 ， ”图 4.12 ROM 
在 声明 中 , 一 个 节点 就 是 由 Key{ 关 键 字 ) 信 息 加 上 两 个 指向 其 他 节点 的 指针 (Left 和 Right) 
组 成 的 结构 ( 见 图 4-13)。 

应 用 于 链表 上 的 许多 法 则 也 可 以 应 用 到 树 上 。 特 别 地 ， 当 进行 一 次 插入 时 , 必须 调用 
mallo 创建 一 个 节点 。 节 点 可 以 在 调用 free 删除 后 被 释放 ， 

我 们 可 以 用 习惯 上 在 画 链 表 时 使 用 的 矩形 框 画 出 二 叉 树 ,但 是 , 树 一 般 画 成 画 圈 并 用 一 

au] SEREREK, A SUNS LACE IE (graph): APRENS, RAE ATE ALE 
NULL 指针 , 因为 具有 N 个 节点 的 每 一 标 二 叉 树 都 将 需要 N + 1 个 NULL 指针 。 





typedef struct TreeNode *PtrToNode; 
typedef struct PtrToNode Tree; 


struct TreeNode 


ElementType Element; 
Trea Left; 
Tree Right; 
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A413 二 及 树 节点 声明 


二 叉 树 有 许多 与 搜索 无 关 的 重要 应 用 - 二 色 树 的 主要 用 处 之 一 是 在 编译 器 的 设计 领域 ， 
我 们 现在 就 来 探索 这 个 问题 。 
4.2.2 REAP 

图 4-14 表示 一 个 表达 式 树 (expression tree) 的 例子 。 表达 式 树 的 树 时 是 操作 数 (operand)， 


比如 常数 或 变 生 ,而 其 他 的 节点 为 操作 蔡 {operater)。 由 于 这 里 所 有 的 操作 都 旦 二 元 的 , 因此 
这 操 特 定 的 树 正 杂 是 并 丸 树 , 最 然 这 是 最 简单 的 情况 , PRD AMAA Ae PA 
儿子 的 。 一 个 节点 也 有 可 能 只 有 一 个 儿子 , 如 其 有 一 目 减 算 符 (unary minus operator) 的 情形 。 
我 们 可 以 将 通过 递归 计算 左 耻 树 和 右 于 树 所 得 刘 的 值 应 用 在 根 钼 的 算 符 操作 吊 而 算出 表 过 式 
Bragg. dea Ire. 左 子 树 的 值 是 "a + (bx o", ATRE d * e) + A tg, 
因此 整个 树 表示 "(a + (b * e) + (((d * e) + D* gi. 


全 一 
oA ae 
e) © 
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图 4-14 “la tb * c)ec((d * et Degn 表达 式 树 


我 们 可 以 通过 递归 产生 一 个 带 括号 的 左 表 达 式 , Aa TE ERAR eA. Ax Pp 
jaune -个 带 括 导 的 丰 表 达 式 出 得 到 一 个 {对 两 个 括号 整体 进行 运算 的 ) 中 织 表 太 式 (infix 
cxpression}。 这 种 一 般 的 方法 (在 , TA. TRA 中 序 遍 上 历 (inorder uaversal); 由 于 其 产生 的 
KERAM, DOM GABA IZ. 

另 一 个 遍历 策略 是 递 归 打 印 出 左 子 树 、 右 子 树 , 然后 打印 运算 符 。 如 困 我 们 应 用 这 种 策 
BS RORY, 则 输出 将 是 "abc* tde itg +", Eu, EE 3.3.3 节 中 的 
后 如 表达 式 。 这 种 遍 册 策略 一 般 称 为 后 序 遍 历 (postorder traversal)。 我 们 稍 早 已 在 4.1 TA 
过 这 种 排序 策略 。 

第 三 种 遍历 策略 是 先 打印 出 运算 符 , IT EP. HR t +a 
x be + * defg" SARA A 8] 58 (prefix I 这 种 遍历 策 咯 为 先 序 遍 历 (preorder traver- 
aD, MERIETE 4.1 节 见 过 它 。 以 后 , 我 们 还 要 在 本 章 讨论 这 些 遍 历 策略 。 
构造 一 棵 表达 式 树 

我 们 现在 给 出 一 种 算法 来 把 后 缀 表达 式 转变 成 表达 式 树 . 由 于 我 们 已 经 有 了 将 中 缀 表达 
忒 续 变 成 后 绷 表 达 式 的 算法 ,因此 我 们 能 够 从 这 两 种 常用 类 型 的 输入 生成 表达 式 树 。 所 描述 
的 方法 酷似 3.2.3 FAS RRA. 我 们 一 次 -个 符号 地 读 人 表达 式 。 如 果 符 号 是 操作 
数 ， 那么 我 们 就 建立 .个 单 节点 树 并 将 一 个 指向 它 的 指针 推 入 伐 中 ， 如 果 符 号 是 操作 符 ， 财 
么 我 们 就 从 栈 中 弹出 指向 项 标 衬 Ti 和 T BAB AP RET CT, 的 先 弹 出 ) 并 撒 成 ~… 棵 新 的 树 ， 
Bus tr SERT. 它 的 左 . LE RUIT, M Ti Ak I EHI po] oc GCSE BS EE BA 
栈 中 。 

来 看 一 个 例子 。 设 答 和 人为: 

abt cedet * * 


前 两 个 符 导 是 操作 数 ,因此 我 们 创建 两 棵 单 节点 树 并 将 指向 它们 的 指针 压 人 栈 中 。 


Oe eae, FEATS LER PSC AS Tat IS 
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RAF 


5 接着 ,“+ "被 恋人 ,因此 指向 这 两 棵 树 的 指针 被 弹出 , Ra AT CL, vua S] EON SET 


|) BAS. 
98 





| 99] 继续 进行 , VRAT * ”号 , 因此 , 我 们 弹出 两 个 树 指 针 并 形成 一 个 新 的 树 ,，“* “号 是 
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的 根 。 


m 3 
最 后 ， 读 人 最 后 一 个 符号 , VERRE. mide] RRO et ES (Et 
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4.3 查找 树 ADT 一 -一 二 又 查找 树 


二 叉 树 的 - .个 重要 的 应 用 是 它们 在 查找 中 的 合用。 假设 树 中 的 每 个 节点 被 指定 一 个 关键 
学 值 。 存 我 们 的 例子 中 , 虽然 任意 复杂 的 关键 字 都 是 允许 的 , 但 为 简单 起 见 , 假设 它们 部 是 
整数 ， 我 们 还 将 假设 , 所 有 的 关键 字 是 互 异 的 , 以 后 再 处 理 有 重复 的 情况 。 

使 二 又 树 成 为 二 灸 查找 树 的 性 质 是 , 对 于 树 中 的 每 个 节点 X. 它 的 左 子 树 中 所 有 关键 字 
fh Fx 的 关键 字 值 , 而 它 的 右 子 树 中 所 有 关键 字 值 大 于 X 的 关键 宁 值 。 注 意 , KERE, 
该 衬 所 有 的 元 素 可 以 用 某 种 统一 的 方式 排序 .在 图 4-15 rp, 左边 的 树 是 二 义 查 找 树 , 但 右边 
的 树 则 不 是 。 右 边 的 树 在 其 关键 字 值 是 6 的 节点 (该 节点 正好 是 根 节 点 ) 的 左 子 树 中 , 有 个 
节点 的 关键 字 值 是 7。 





图 4-15 两 棵 二 丸 树 {只 有 左边 的 树 是 查找 树 ) 


现在 给 出 道 党 对 二 叉 查 找 树 进行 的 操作 的 简要 描述 。 注 意 , 由 于 树 的 递归 定义 , 通常 大 
递归 地 编写 这 些 操作 的 例 程 。 因 为 二 又 查找 树 的 平均 深度 是 O (log ND, 所 以 我 们 一 般 不 必 
操心 栈 空 间 被 用 尽 。 存 图 4-16 中 我 们 重复 类 型 定义 并 列 出 函数 的 一 些 性 质 。 由 于 所 有 的 元 
素 都 是 有 有 序 的 , 因此 , 昔 然 对 某 些 类 型 也 许 会 出 现 语法 错误 , 但 我 们 还 中 要 假设 运算 符 <”. 
“A = "可 以 用 于 这 些 元 未。 

4.3.1 MakeEmpty 

这 个 操作 主要 用 于 初始 化 。 有 些 程序 设计 入 员 更 感 意 将 第 一 个 元 素 初始 化 为 单 节 名 树 ， 
但 是 ,我 们 的 实现 方法 更 紧密 地 遵循 树 的 递归 定义 。 正 如 图 4-17 中 显示 的 , 它 是 一 个 简单 的 
mA: 
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#ifndef Tree. H 


Struct TreeNode; 
typedef struct TreeNode *Position; 
typedef struct TreeNode *SearchTree; 


SearchTree MakeEmpty( SearchTree T 3; 

Position Finde ElementType X, SearchTree T 3: 
Position FindMin( SearchTree T ); 

Position FindMax( SearchTree T 2; 

SearchTree Insert( ElementType X, SearchTree T ); 
SearchTree Delete( ElementType X, SearchTree T }; 
ElementType Retrieve( Position P 3; 


endif /* Tree */ 


/* Place in the implementation file */ 
struct TreeMode 

{ 

ElementType Element; 

SearchTree Left: 

Searchiree Right: 


hi 


图 4-16 SOM ERA EHE 


SearchTree 
MakeEmpty( SearchTree T ) 


if( T im NULL 3 
MakeEmpty( T-»Left ): 


MakeEmpty( T-»Right 5; 
free€ T ); 


] 
return NULL; 


H 





图 4-17 建立 一 棵 空 树 的 例 程 


4.3.2 Find 

这 个 操作 一 般 需 要 返回 指向 树 了 中 具有 关键 字 X 的 节点 的 指针 ， 如 果 这 样 的 节点 不 存 
在 则 返回 NULL。 树 的 结构 使 得 这 种 操作 很 简单 。 如 有 果 了 是 NULL, 那么 我 们 可 以 就 返回 
NULL. GM, 如果 存 赃 在 工 中 的 关键 字 是 X, 那么 我 们 可 以 返回 T. EN, 我们 对 树 了 的 
左 子 树 或 右 子 树 进行 一 次 递归 调用 , 这 依赖 于 X 与 存储 在 T 中 的 关键 字 的 关系 。 图 4-18 中 
的 代码 就 是 对 这 种 策略 的 一 种 体现 。 

注意 测试 的 顺序 。 关 键 的 问题 是 首先 要 对 是 否 为 空 树 进行 测试 ,否则 就 可 能 在 NULL 
指针 上 呢 轿 子 。 其 余 的 测试 应 该 使 得 最 不 可 能 的 情况 安排 在 最 后 进行 。 还 要 注意 ， 这 里 的 两 
个 递归 调用 事实 上 都 是 尾 递归 并 且 可 以 用 一 次 赋值 和 一 个 goto TARAR ARE. EH 
的 使 用 在 这 里 是 合理 的 ， 因为 算法 表 近 式 的 简明 性 是 以 速度 的 距 低 为 代价 的 ， 而 这 毕 所 使 用 
的 楼 空间 的 量 也 只 不 过 是 O(log NOME. 
4.3.3 FindMin 和 FindMax | | 

这 些 例 程 分 别 返 回 树 中 最 小 元 和 最 大 元 的 位 辣 。 虽然 返回 这 些 元 素 的 准确 值 似 平 更 合 
EB, 但 是 这 将 与 Find 操作 不 相 容 。 重 要 的 是 ， 看 起 来 类 似 的 操作 做 的 工作 也 是 类 似 的 。 为 抄 


一 ——— 一 -一 一 -一 一 一 一 一 -一 一- 一 一 - 一 一 一 一 一 一 一 -一 一 — —- —— —— ——— 一 一 -一 


— 
| Position 
| Find( ElementType X, SearchTree T } 
| if( T == NULL 》 
| return NULL; 
iff X < T-»Element ) 
| return Find{ X, T->Leftt 5; 
| else | 
itë X > T-»Elemant } | 
| return Find( X, T-»Ríght J; 


| 
| 
i 


A] 4-18 一 叉 查 找 树 的 Find 操作 


行 下 indiMin ， 从 根 开 始 并 且 只 要 有 左 儿 子 就 向 左 进 行 . 终止 点 是 最 小 的 正楷 ，、FindMax fife 
除 分 支 朝 向 右 几 子 外 其 余 过 程 相同 。 

这 种 递归 是 如 此 和 容易 以 至 于 许 窜 程 序 没 计 员 不 上 大 其 和 产地 使 用 它 。 我 们 用 两 种 方法 纳 写 这 
两 个 例 程 , 用 递归 编写 FindMin, 而 用 非 递 归 编 号 FindMax( IL Eg 4-19 和 图 4-20), 


Position 
FindMin€ SearchTree T ) 


if T == NULL } | 
return NULL; 


if( T-»Left == NULL ) 
return T; 


| { 
| else 
| 


else 


retura FindMin( T-»Left 3; 
} 


图 419 X[— X ARRAY FindMin IPEA ASEH 


Position 
FindMax( SearchTree T } 
í ! 


| if{ T l= NULL 3 
| while( T-»Right l= NULL ) | 
T = T->Right; 


return T; | 
1 





4 


图 4.20 ”对 二 及 查找 树 的 Find Max 的 非 递 归 实 现 


注音 我 们 是 如 何 小 心地 处 理 空 树 这 种 退化 情况 的 。 盘 然 小 心 总 是 各 坚 约 ， 但 在 北上 归程 他 
HERRERA, tih, 还 要 注意 , 在 FindMax 中 对 T 的 改变 是 安全 的 ， 因为 我 们 只 用 持 贞 来 
进行 工作 。 不 管 怎 么 说 , 还 是 应 该 随时 特别 小 心 , 因为 诸如 *T -> Right = T -> Right 7 
> Right" 这 样 的 语句 将 会 产生 一 些 变化 。 

4.3.4 Insert | 

进行 插 人 操作 的 例 程 在 概念 上 是 简单 的 。 为 了 将 X BART 中 ， 称 可 以 像 用 Find a 
Boc AER. WRRA X, 则 什么 也 不 用 做 (或 做 一 些 “ 更 新 ”)。 和 否则, EX A 
路 和 从 上 的 最 后 一 点 上 。 图 4-21 显示 实际 的 插入 人情 帝 。 为 了 插入 5, 我 们 遍历 该 树 就 好 像 在 运 


17 Find。 在 具有 关键 字 4 的 节点 处 ,我 们 需要 疝 右 行进 , 但 右边 不 存在 子 树 , 因此 5 不 在 这 
RRE, 从 而 这 个 位 置 就 是 所 要 揪 人 的 位 置 。 






图 4-21 在 插入 5 以 前 和 以 后 的 二 叉 查 找 树 


重复 元 的 插 人 可 以 通过 在 节点 记录 中 保留 一 个 附加 域 以 指示 发 生 的 频率 来 处 理 。 这 使 束 
个 的 树 增加 了 某 些 附加 空间 , 但 是 , 却 比 将 重复 信息 放 到 树 中 要 好 ( 它 将 使 树 的 深度 变 得 很 
JO, HR, 如 果 关 键 字 只 是 一 个 更 大 结构 的 一 部 分 , 那么 这 种 方法 行 不 通 ， 此 时 我 们 可 以 把 
只有 相同 关键 字 的 所 有 结构 保留 在 一 个 辅助 数据 结构 中 , 如 表 或 是 另 一 棵 查找 梢 中 。 

图 4.22 显示 插入 例 程 的 程序 。 由 于 T 指向 该 树 的 根 , 而 根 又 在 第 一 次 揪 人 时 变化 , PS 
此 Insert 被 写成 一 个 返 同 指向 新 树 根 的 指针 的 函数 。 第 8 行 和 第 10 行 递归 地 播 和 人 X. 到 适当 
BUT BB 


5earchIree 
Insert( Elementtype X, SearchTree T ) 
i 
/* 1*/ ift T == NULL } 
{ 
/* Create and return a one-node tree +f 
/* 2g" T = malloc( sizeaf( struct TreeNode 2 >; 
/* 3*/ iff T = NULL 3 
f/* 4A*/ FatalError( “Out of space!!!" J; 
else 
{ 
A" 5*/ T->Element = X; 
/* 6*/ T-»Left = T-»Right - NULL; 
t 
} 
else 
/* Tr iff X < T-»Element > 
/* B*/ T-»Left = Insert( X, T-»Left ); 
else 
/* 9*/ if X > T-»Element J 
/*10*/ T-»Right = Insert( X, T-»Right 3; 
/* Else X is in the tree already; we'll do nothing */ 


/*11*/ return T: /* Do not forget this line!! * f 





E422 插 人 元 素 到 二 叉 查 找 树 的 例 在 


4.3.5 Delete 
正如 许多 数据 结构 一 样 。 最 困难 的 操作 是 删除 。 一 日 发 现 要 被 删除 的 节点 , 我 们 就 需要 
考虑 几 种 可 能 的 情况 。 


如 果 节 点 是 一 片 树 叶 , 那么 它 可 以 被 立即 删除 。 如 果 节 点 有 一 个 儿子 , 则 该 节点 可 以 在 
其 父 节 点 调整 指针 绕 过 该 节点 后 被 删除 (为 了 清楚 起 锡 ， 我 们 将 明确 地 画 出 指针 的 指 问 ), 3L 


Hf 


4-23. (eR, SRE PRE A, 而 该 斑点 只 有 在 指 同 它 的 指针 已 被 省 去 的 情 


ot A AES ATS . 
6 
E VU 8) 
s 4 


A423 具有 :个 几 了 了 的 节点 (4}) 删 除 前 后 的 情况 


复杂 的 情况 是 处 理 有 具有 两 个 儿子 的 节点 ,一 般 的 删除 策略 是 用 其 本 于 树 的 最 小 的 数据 
{很 容易 找到 ) 人 入替 该 节点 的 数据 并 递归 地 删除 那个 节点 {现在 它 尾 室 的 }。 因 为 右 了 于 树 中 的 最 
小 的 节点 不 可 能 有 在 儿 子 , 所 以 第 二 次 Delete 删除 ) 要 容易 。 图 4-24 显示 一 村 初始 的 树 太 其 
中 一 个 节点 被 删除 后 的 结果 .， 要 被 期 除 的 节点 是 恨 的 左 几 子 ; 其 关键 宁 是 2。 它 被 石子 树 中 
的 最 小 数据 (3) 所 代 些 ,然后 关键 字 是 3 的 原 节 点 如 前 例 那 样 被 删 际 。 





图 4-24 ”删除 其 有 两 个 几 子 的 节点 (2) 前 后 的 情 沉 


图 4.25 中 的 程序 完成 删除 的 工作 , BEREH TS., 因为 它 沿 该 树 进 行 两 冻 搜 索 以 查 
找 和 删除 右 子 树 中 最 小 的 节点 。 写 一 个 特殊 的 DeleteMin ga V 容易 地 改变 效率 不 疝 的 缺 
eh, FRA TE Jc BON TS 

如 果 删 除 的 次 数 不 多 , MAA (FAY) RR C lazy deletion): 35 — T 2L 2B 
除 时 ， 它 仍 备 在 树 中 ,而 是 只 做 了 个 被 册 除 的 记号 。 这 种 做 法 特别 是 在 有 重复 关键 子 时 很 六 
行 , 因为 此 时 记录 出 现 频率 数 的 域 可 以 减 Ls 如 果树 中 的 实际 节点 数 和 “被 删除 ”的 节点 数 相 
mj. 那么 树 的 深度 预计 只 上 升 一 个 小 的 常数 (为 什么 ?)》 因此 ， 存在 一 个 与 懒惰 删除 相关 的 非 
党 小 的 时 间 损 耗 。 再 有 ， 如 果 被 删除 的 关键 字 是 重新 插 人 的 ， 那么 分 配 一 个 新 单元 的 开销 号 
AT. 
4.3.5 平均 情形 分 桥 

TORE, BE MakeEmpty 外 ， 我 们 期 望 前 一 节 所 有 的 操作 都 花费 O Clog NATAL, 因为 我 
们 用 常数 时 间 在 树 中 降低 了 一 技 ， 这 样 一 来 , 对 树 的 操作 大 致 减少 一 半 左 右 。 utc, BR Ma- 


78 BAF 


Searchirea 


Dalete( Elementiype X, Searchfree T ) 


| 
| Position TmpCell; 
| 















if( T == NULL ) 
Error& "Element not found" 3; 
glse 
ift X < T-»Elament ) /* Go left */ 
T-»Left = Delertet X, T-»Left 3; 
else 
if( X > T->Element ) /* Go right */ 
T-»Right = Delete( X, T->Left ); 
else /* Found element ta be deleted */ 
iff T-»Left && T-»Right 3  /* Two children */ 
{ 
/* Replace with smallest in right subtree */ 
TmpCel]l = FindMin( T-»Right ): 
T--Element = TmpCelt->£lement; 
T--Right = Delete( T-»EJement, T--Right ); 
} 
else /* One or zero children */ 
Tmpcetl = T; 
if Y-»Left «= NULL } /* Also handles Q children */ 
T = T-»Right; 
else if( T-»Right == NULL } 
T = T-»Left; 
freet impCel! 3; 
] 
return T; 
|” on 


图 4-25 “MARA RI ER ERE 


keEmpiy 外 ,所 有 的 操作 都 是 OCd), 其 中 d 是 包含 所 访问 的 关键 字 的 节点 的 深度 。 

我 们 在 本 节 要 证 明 , 假设 所 有 的 树 山 现 的 机 会 均等 , 则 树 的 所 有 节点 的 平均 深度 为 
O(log N)« 

_- 棵 树 的 所 有 节点 的 深度 的 和 称 为 内 部 路 径 长 (intermal path length)。 我 们 现在 将 要 计算 二 
叉 查 找 树 平均 内 部 路 径 长 , 其 中 的 平均 是 对 向 二 义 查找 树 中 所 有 可 能 的 插入 序列 进行 的 。 

A D(N) 是 具有 N 个 节点 的 某 棵 树 人 的 内 部 路 径 长 ,，D(1) = 0。 一 栋 N 市 点 树 是 由 
一 棵 i 节点 左 子 树 和 一 棵 (N 一 i 一 1) 贡 点 右 子 树 以 及 深度 为 0 的 一 个 根 节点 组 成 , 其 中 ss 
< N，D(i) 为 根 的 在 子 树 的 内 部 路 径 长 。 但 是 在 原 树 中 , 所 有 这 些 节 点 都 要 加 次 一 度 。 同样 
的 结论 对 于 右 子 树 也 是 成 立 的 。 因 此 我 们 得 到 递归 关系 : 

DON) = DG) + DIN -i-1)+N-1 
如 果 所 有 子 树 的 大 小 都 等 可 能 地 出 现 , 这 对 于 二 叉 查找 树 是 成 立 的 (因为 子 树 的 大 小 只 依赖 
于 第 一 个 揪 入 到 树 中 的 元 素 的 相对 的 秩 ), 但 对 于 二 叉 树 则 不 成 立 ,那么 DG) 8I DON - 2 - D 


的 平均 值 都 是 (1AN) D Do FH 
pin) = &[ 3; DG)]* N - 1 


在 第 7 章 将 遇 到 并 求解 这 个 递归 关系 , 得 到 的 平均 值 为 DCN) = OCN log N) AREST 
点 的 期 望 深度 为 D(iog N)。 作 为 一 个 例子 , 图 4-26 所 示 随 机 生成 的 500 个 节点 的 酝 的 节点 


平均 深度 为 9.98。 








图 4-26 ”一 棵 随机 生成 的 二 叉 查 找 树 


但是 ,上 来 就 断言 这 个 结果 意味 着 上 一 上 节 讨 论 的 所 有 操作 的 半 均 运行 时 间 是 O Clog N) 
并 不 完全 正确 。 原 因 在 于 删除 操作 , 我 们 并 不 清楚 是 否 所 有 的 一 文 查找 柑 邦 是 过 可 能 出 现 
的 。 特 别 是 ， 上 面 描 述 的 删除 算法 有 助 于 使 得 左 子 树 比 句子 树 深度 深 ,因为 我 们 总 是 用 右 开 
树 的 个 节点 来 代替 删除 的 节点 。 这 种 策略 的 准确 效果 仍然 是 林 知 的 , 但 它 似 平 只 是 理论 上 
的 恋 团 。 已 经 证 明 ， 如 果 我 们 交替 插 人 和 删除 B(N2) 次 , 那么 树 的 期 望 深度 将 是 OWN). 
在 25 万 次 随机 Insert Delete 后 , 图 4-26 中 右 沉 的 树 看 起 来 明显 地 不 平衡 (平均 诛 度 = 
12.51), ME 4-27。 
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Ei 4.27. 1E GN? IK Insert/Delete 后 的 二 叉 查 找 树 


ERRER, Ri C Raha ICR AT RR ATRL E H 
除 的 元素 以 消除 这 种 不 平衡 问题 。 这 种 做 法 明 显 地 消除 了 上 述 偏向 并 使 树 保 持平 衡 , 但 是 , 没 
有 人 实际 上 证 明 过 这 一 点 。 这 种 现象 位 乎 主要 是 理论 上 的 问题 , 因为 对 于 小 的 树 上 述 效 果 根 本 
显示 不 出 来 , 甚至 更 奇怪 , 如 果 使 用 oCNT)Xf Inseri/Delete, 那么 笃 似 乎 林 以 得 到 平衡 ! 

上 上面 的 讨论 主要 是 说 明 ，, 明确" 平均 "意味 着 什么 一 般 是 极其 困难 的 ， 可 能 需要 一 些 假 
i. 这 些 假设 可 能 合理 , 也 可 能 不 合理 ， 不过， 在 没有 删除 或 是 使 用 懒惰 删除 的 情况 下 .可 
以 证 明 所 有 二 叉 查 找 树 都 是 等 可 能 出 现 的 ， 市 且 我 们 可 以 断言 : 上 述 那 些 操作 的 平均 运行 时 
lala ht O(log N). 除 像 上 上 面 讨论 的 一 些 个 别 情 形 外 ， 这 个 结 呆 与 实际 观察 到 的 情形 是 非常 
WITH). 

如 果 向 一 标 预 先 排序 的 树 输入 数据 那么 一 连 串 Insert 操作 将 收费 二 次 时 间 ， 而 链表 实 


1101 
10s] 


109 


80 BAF 
现 的 代价 会 非常 巨大 , 因为 此 时 的 树 将 只 由 那些 没有 左 儿 子 的 节点 组 成 。 一 种 解决 办 法 就 是 
要 有 一 个 称 为 平衡 (batance) 的 附加 的 结构 条 件 ; 任何 节点 的 深度 均 不 得 过 深 . 

有 许多 一 般 的 算法 实现 平衡 树 。 但 是 ,大 部 分 算法 都 要 比 标 淮 的 二 了 叉 查 找 树 复 淋 得 多 ， 
而 且 更 新 要 平均 花费 更 长 的 时 间 。 不 过 , 它们 确实 防止 了 处 理 起 来 非常 麻烦 的 一 些 简 单 情 
É. FEL 我 们 将 介绍 县 老 的 一 种 平衡 查找 酝 , BI AVL 树 。 

另外 ， 较 新 的 方法 是 放弃 平衡 条 件 , 允许 树 有 任意 的 深度 , 但 是 在 每 次 操作 之 后 要 使 用 
一 个 调整 规则 进行 调整 , 使 得 后 面 的 操作 效率 更 高 。 这 种 类 型 的 数据 结构 一 般 怖 于 上 日 调 整 
《self-adiusting) 类 铬 构 。 在 二 叉 查 找 树 的 情况 下 ， 对 子 任 意 单 个 运算 我 们 不 再 保证 Oog N) 
的 时 间 界 , 但 是 可 以 证 明 任 意 连 续 M 次 操作 在 最 坏 的 情形 下 花费 时 间 为 OM log ND. 一 般 
这 足以 防止 令 人 环 手 的 最 坏 情 形 。 我 们 将 要 讨论 的 这 种 数据 结构 叫做 伸展 树 (splay tree): © 
IA HEB EAE A, 我 们 将 在 第 11 章 讨论 。 


4.4 AVL BÍ 


AVI (CAdelson-Velskii 和 Landis) 树 是 带 有 平衡 条 件 的 二 叉 查 找 树 。 这 个 平衡 条 件 必 须要 
容易 保持 , 而 且 它 贫 保证 树 的 深度 是 OUog N)。 最 简单 的 想法 是 要 求 左 右 子 树 共有 相同 的 
高 度 。 如 图 4-28 所 示 , 这 种 想法 并 不 强求 树 的 深度 要 浅 。 

另 一 种 平衡 条 件 是 要 求 每 个 节点 都 必须 要 有 相间 高 
度 的 天 子 树 和 右 子 树 。 如 果 空 子 树 的 高 度 定义 为 一 1( 通 
常 就 是 这 么 定义 ), 那么 只 有 有 具有 F- 工 个 节点 的 理想 平 
衡 树 (perfeetly balanced tree) 满 足 这 个 条 件 。 因 此 , 虽然 这 
种 平衡 条 件 保 证 了 树 的 深度 小 , 但 是 它 太 严格 , 难以 使 
用 , SERRE, 

_ 棵 AVL 树 是 其 每 个 节点 的 左 子 树 和 右 子 树 的 高 度 。 图 428 REE OUS. AR 
最 多 差 1 的 二 叉 查找 树 。( 空 树 的 高 度 定义 为 - 1。) 在 图 ERT AP BURNER 
429 中 ,左边 的 树 是 AVL, 但 是 右边 的 梢 不 是 。 每 一 个 节点 (在 其 节点 结构 中 ) 保 留 高 度 
信息 。 可 以 证 明 , KAEH, 一 个 AVL 树 的 高 度 最 多 为 1. 44lcg(NN+2) — 1.328, 但 是 实际 
上 的 高 度 只 比 logN 稍微 多 一 些 。 作 为 例子 , 图 4-30 显示 一 棵 具有 最 少 节点 (143) 高 度 为 9 
的 AVL 树 。 这 樟树 的 左 子 树 是 高 度 为 ? 且 节 点 数 最 少 的 AVL 树 , 右 子 树 是 高 度 为 8 的 节点 
数 最 少 的 AVL 树 。 它 告诉 我 们 , 在 高 度 为 h W AVLA, 最 少 节点 数 SCAU SCR) = 
Sth-1)+ S(h -22 *1 Eris MF A=0,S(A)H1; h-1, SCA) =20 函数 SCA) AGSEDRAR 
usu, Bulb E BIN F AVL 树 的 珊 度 的 党 。 

因此 , 除去 可 能 的 插 人 外 {我 们 将 假设 懒 情 删除 )， 所 有 的 树 操 作 都 可 以 以 时 间 O(log NOTA 
行 。 当 进行 播 人 操作 时 ， 我 们 需要 更 新 通 向 根 和 节点 路 径 上 那些 节点 的 所 有 平衡 信息 ， 而 播 人 
操作 隐 含 着 困难 的 原因 在 于 ; 插 人 一 个 节点 可 能 破坏 AVL 树 的 特性 。{ 例 如 , 将 6 插入 到 图 
4-29 中 的 AVL 树 中 将 会 破坏 关键 字 为 8 的 节点 平衡 条 件 。) 如 果 发 生 这 种 情况 , 那么 就 要 把 
性 质 恢复 以 后 才 认 为 这 一 步 播 人 完成 。 雪 实 上 上， 这 总 可 以 通过 对 树 进 行 简单 的 修正 来 做 到 ， 
FREY & d (rotation). 

在 播 人 以 后 ， 血 有 那些 从 插入 点 到 根 节点 的 路 径 上 的 节点 的 平衡 可 能 被 改变 ， 因为 只 有 
这 些 节 点 的 子 树 可 能 发 生变 化 。 当 我 们 沿 着 这 条 路 径 上 行 到 根 并 更 新 平衡 信息 时 , 我 们 可 以 
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找到 -一 个 节点 , 它 的 新 平衡 破坏 了 AVL 条 件 。 我 们 和 将 指出 如 何在 第 一 个 这 样 的 节点 5 即 最 涂 
的 节点 ) 重 新 平衡 这 棵 树 ， 并 证 明 , 这 一 重新 平衡 保证 整个 树 满 足 AVL 特性 。 

让 我 们 把 必须 重新 平衡 的 节点 叫做 。 由 于 任意 节点 最 多 有 了 两 个 儿子, 因此 高 度 不 平 黎 
M. a 点 的 两 标 子 和 树 的 高 度 差 2。 容 易 看 出 , 这 种 不 平衡 可 能 出 现在 下 面 四 种 情况 中 

1. 对 a 的 左 儿 子 的 左 子 树 进 行 一 次 插入 。 

2. 对 a 的 左 儿 于 的 右 子 树 进 行 一 次 插入 。 

3. 对 a 的 右 儿 子 的 左 子 柑 进行 一 次 插入 。 

4. 对 o 的 右 儿 子 的 右 子 树 进 行 : -次 搬入 ， 

情形 | 和 4 是 关于 a 点 的 镜像 对 称 , 而 2 和 3 是 关于 a 点 的 镜像 对 称 。 因 此 , BUE ER 
有 两 种 情况 ,当然 从 编程 的 角度 来 看 还 是 四 种 情形 . 

第 一 种 情况 是 播 和 人 发生 在 “外 边 " 的 情况 ( 即 左 - 左 的 情况 或 右 一 右 的 情 沈 )， 该 情况 通过 
RT AY AY — UK 3-3 He ( single rotation) 而 完成 调整 - 第 二 种 情况 是 插入 发 生 在 “内 部 TA B 
左 - 厂 的 情况 或 石 - 左 的 情况 )， 该 情况 通过 稍微 复杂 些 的 双 旋 转 (double rotation € AR FE, 我 
们 将 会 看 到 ,这些 部 是 对 树 的 基本 操作 ， 它们 多 次 用 于 平衡 树 的 一 些 算 法 中 -本 节 其 余部 分 
将 描述 这 些 旋 转 , 证 明 它 们 足以 保持 树 的 平衡, FE AVL 树 的 一 神华 正 式 实 现 方法 : 
第 42 章 描述 其 他 的 平衡 树 方法 , 这 些 方法 着 眼 于 AVL 树 的 更 仔细 的 实现 - 


DLE Sad 


4.4.1 单 旋转 

图 4-31 显示 单 旋 转 如 何 调整 情形 1。 旋 转 前 的 图 在 左边 ， 而 旋转 后 的 图 在 右边 。 计 我 们 
上 米 分 析 具 体 的 做 法 。 节 点 k 不 满足 AVL 平衡 特 人 性， 因为 它 的 左 子 树 比 右 子 树 深 2 层 ( 图 中 
问 的 几 条 虚线 标示 树 的 各 层 )。 该 图 所 描述 的 情况 只 是 情形 1 的 一 种 可 能 情况 ,在 椰 人 之 六 


— kh WE AVL 特性 , 但 在 播 人 之 后 这 种 特性 被 破坏 了 。 子 树 了 已 经 长 出 一 层 , 这 使 得 它 比 于 


树 Z 深 出 2 层 。Y 不 可 能 与 新 XX 在 同一 水 平 上 ,因为 那样 k 在 插入 以 前 就 已 经 失去 平衡 
T: Y 也 不 可 能 与 Z 在 同一 层 上 , 因为 那样 1 就 会 是 在 通 向 根 的 路 径 上 人 破坏 AVL 平 衡 条 件 
的 第 -个 节点 。 





图 4-31 调整 情形 1 的 单 旋转 


为 使 树 恢复 平衡 , 我 们 把 X 上 移 一 层 , 并 把 Z FS. RE, 此 时 实际 上 超出 了 
AVL 特性 的 要 求 。 为 此 , 我 们 重新 安排 节点 以 形成 一 柑 等 价 的 树 ， 如 图 4-31 的 第 二 部 分 所 
示 。 抽 人 象 地 形容 就 是 : 把 树 形象 地 看 成 是 柔软 灵活 的 , 抓 住 节点 ki 闭 上 你 的 双眼 , Se 
me, 在 重力 作用 下 , k 就 变 成 了 新 的 根 。 二 又 查 找 椅 的 性 质 告诉 我 们 , 在 原 树 中 k> by, 
于 是 在 新 树 中 h 变 成 了 上 &| 的 右 儿 子 , X AZ 仍然 分 别 是 | 的 左 儿 子 和 上 的 右 儿 子 。 子 树 
Y 包含 原 树 中 介 于 M k 之 间 的 那些 节点 , 可 以 将 它 放 在 新 粳 中 2 的 左 儿子 的 位 置 上 ,这 
样 ， 所 有 对 顺序 的 要 求 都 得 到 满足 。 

这 样 的 操作 只 需要 一 部 分 指针 改变 , 结果 我 们 得 到 另外 一 棵 二 叉 查找 椅 ， 它 是 一 标 
AVL 树 , 因为 X 向 上 移动 了 一 屋 ，Y 停 在 原来 的 水 平 上 , 而 Z FBR. kM ki DA 
E AVL BOR, 而且 它们 的 子 树 都 恰好 处 在 同一 高 度 上 。 不 仅 如 此 , 整个 树 的 新 高 度 恰恰 
与 插入 前 原料 的 高 度 相同 , 而 插入 操作 却 使 得 子 树 X 长 高 了 。 因 此 , 通 向 根 节点 的 路 径 的 
高 度 不 需要 进一步 的 修正 , 因而 也 不 需要 进一步 的 旋转 。 图 4-32 显示 在 将 6 插入 左边 原始 
的 AVL 树 后 节点 8 便 不 再 平衡 。 于 是 , 我 们 在 7 和 8 ZAR KARE, BRA 
的 树 。 





图 4.32 插入 5 破坏 了 AVI. 特 性， 而 后 经 过 单 旋 转 又 将 特性 依 蓝 
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Hel 4-33 单 旋转 覆 复 情形 4 


(E 好 我 们 较量 提 到 的 , 情形 4 代表 一 种 对 称 的 情形 。 侠 4-33 Fe Bee mer FTH. LESE 
位 演示 一 个 稍微 长 一 些 的 例子 ， 根 设 从 初始 的 空 AVL AAA KEE 3.291, 然后 依 
序 插 人 4 到 7 了 7。 在 插 人 关键 字 | 时 第 一 个 问题 出 现 了 ，AVL 特性 在 根 处 被 破坏 。 我 们 在 根 二 
其 左 儿 子 之 间 施 行 单 旋转 修正 这 个 问题 。 下 面 是 旋转 之 前 和 之 后 的 两 棵 笃 ， 


a 0 > 
V T a 


a 旋转 之 前 旋转 之 后 


图 中 虚线 连接 两 个 节点 , 它们 是 旋转 的 让 体 ， 下 阁 我 们 搬入 关键 宁 为 4 的 节点 ,这 没有 问 
题 , 但 插入 5 破坏 了 在 节点 3 处 的 AVL 特性 , te ee OO Rh. BRIEFS ie A 
ish, REAR DAE: 树 的 其 余部 分 必须 知晓 该 变化 。 如 本 例 中 节点 二 的 石 儿子 必 
须 生 新 设置 以 指向 4 来 代替 3。 这 一 点 很 容易 让 记 ， 从 而 导致 树 被 骸 坏 (4 就 会 地 不 可 访 
IE). 
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下 而 我 入 搬 估 6。 这 在 根 节点 产生 一 个 平衡 问题 ， 因 为 它 的 左 子 树 高 虎 是 0 而 石 THE 
度 为 2。 困 此 我 们 在 根 处 在 2 各 4 之 间 实 施 UK EAS 





E i 4 l 
旋转 之 前 X 旋转 之 后 


n 


sek ag £t et 2 是 4 的 一 个 儿子 而 4 GOR PIA TE 2 的 新 的 右 了 树 。 在 该 子 树 二 
的 每 - -个 关键 字 均 在 2 和 4 ze), 因此 这 个 变换 是 成 立 的 。 我 们 插入 的 下 一 个 关键 子 丰 T, 


它 导 致 另外 的 旋转 : 





旋转 之 前 


4.4.2 WHE 
上 面 描述 的 算法 有 一 个 问题 如 图 4-34 所 示 , 对 于 情形 2 和 3 上 面 的 做 法 无 效 。 问 题 在 
于 子 树 YAR, 单 旋转 设 有 减低 它 的 座 度 。 解 决 这 个 问题 的 双 旋 转 在 贸 4-35 中 表 出 。 





图 4-35 左 - 右 双 旋 转 收 复 情 形 2 


ER 434 中 的 子 树 Y 已 经 有 有 一 项 插入 其 中 , 这 个 事实 保证 它 是 非 空 的 。 因 此 ,我 们 可 
以 假设 它 有 一 个 根 和 两 标 子 树 。 于 是 , 我 们 可 以 把 整 棵 树 看 成 是 四 梨子 树 由 3 个 节点 连接 。 
如 图 所 示 , See B 或 树 C 中 有 一 棵 比 D 深 两 层 ( 除 非 它 们 都 是 空 的 ), 但 是 我 们 不 能 肯 完 
是 哪 一 棵 。 事实 上 这 并 不 要 紧 , 在 图 4-35 中 B 和 C 都 被 画 成 比 DD 低 15:8. 

为 了 重新 平衡 , 我 们 看 到 , 不 能 再 让 作为 根 了 , 而 图 4-34 所 示 的 在 &s P ki ZM RINE 
转 又 解决 不 了 问题 , 惟一 的 选择 就 是 把 ko 用 作 新 的 根 。 这 迫使 ki 是 & 的 左 儿 子 ，&s EE 
的 右 儿 子 , 估 而 完全 确定 了 这 四 标 树 的 最 终 位 置 。 容 易 看 出 , 最 后 得 到 的 树 满足 AVL 出 的 
特性 , 与 单 旋转 的 情形 一 样 , 我 们 也 把 树 的 高 度 恢复 到 插入 以 前 的 水 平 , 这 就 保证 所 有 的 重 
新 平衡 和 高 度 更 新 是 完善 的 。 图 4-36 指出 , 对 称 情形 3 也 可 以 通过 双 旋 转 得 以 修正 。 在 这 两 
种 情形 下 , 其 效果 与 先 在 a 的 下 子 和 孙子 之 间 旋 转 而 后 再 在 和 它 的 新 儿子 之 间 旋 转 的 效 未 
是 相同 的 。 

我 们 继续 在 前 面 例 子 的 基础 上 以 倒序 插入 关键 字 10 到 16, 接着 搬入 8, 然后 再 插入 9. 
播 人 16 容易 ,因为 它 并 不 破坏 平衡 特性 , 但 是 插入 15 就 会 引起 在 节 成 7 处 的 高 度 不 平衡 。 
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图 4.36 A- ANE RE AE 3 5 
1 
SNH 3, 需要 通过 -次 右 - 左 双 旋 转 来 解决 。 在 我 们 的 例子 中 ,这 个 证 堪 双 旋 转 将 涉及 US 
7, 16 和 415， 此 时 , 4, 是 具有 关键 字 7 的 节点 , kh 是 内 有 关键 字 LON TA, n k ERAK 
Bee 15 ER. FBLA B. CHD 都 是 空 树 。 





3 1 ky ky 
旋转 之 有 48) EIE G o 


下 面 我 们 插入 14, CUP E TOUR. WE EAH, E 
将 涉及 6、15 和 7。 在 这 种 情况 下 , b, 是 具有 关键 学 6 的 节点 ，&2 是 共有 关键 字 7 了 的 节点 ， 
fii 6, 是 具有 关键 字 15 的 节点 。 子 树 A 的 根 在 关键 字 为 5 的 节点 上 , THB ASTM, 它 是 
美 键 字 7 的 节点 原先 的 左 儿 子 , 子 树 C 置 根 于 关键 字 14 的 节点 D. E. DD IREX 
Er 16 ATE 





ks, 
16 
旋转 之 前 14) 


MENERA 13, 那么 在 根 处 就 会 产生 一 个 不 平衡 - 由 于 13 不 在 4 和 7 之 问 ， 因此 我 
们 知道 一 次 单 旋转 就 能 完成 修正 的 工作 。 
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12 的 插 人 也 需要 一 个 单 旋转 ， 





为 了 插 和 人 11, 还 需要 进行 一 个 单 旋转 ， 对 于 其 后 的 10 的 插 人 也 需要 这 样 的 旋转 。 我 们 
插 和 人 8 不 进行 旋转 ,这 样 就 建立 了 一 棵 近乎 理想 的 平衡 树 . 





最 后 , 我 们 插 人 9 以 演示 双 旋 转 的 对 称 情形 。 注 意 , 9 引起 含有 关键 字 10 的 节点 产生 不 
平衡 。 册 于 9 在 10 和 8 之 间 (8 是 通 向 9 的 路 径 上 的 节点 10 的 儿子 ), 因此 需要 进行 一 个 双 
iis] 旋转 , 我 们 得 到 下 面 的 树 : 





现在 计 我 们 对 上 面 的 讨论 作 个 总 结 。 除 几 种 情形 外 ,编程 的 弓 节 是 相当 简单 的 。 为 将 天 
键 字 是 X 的 一 个 新 节点 插 人 到 一 哥 AVL OT PA, 我 们 递归 地 将 X 捅 人 到 人 的 相应 的 于 
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s. 那么 我 们 根据 蕊 以 及 于 各 ibas Wek cree ieee cm E Py it YS E H 
fug GHA BRP HERE). MOSER HA. H FoR meee RE AA a, PIEI 
2 Hb 5 E 3E BUS RE ES ae SBI RS. SRT, BOSE BR a T L 
TA SER GENE), BEITE ACA TR AREI ASE AVL RI, 

另 APRESS LBS BRB Se. INT AI GHI kie PS EN, 
BREET). GORA ik AK, MIARA ae a ARN, U, meen 
个 益 。 这 么 做 将 避免 平衡 因 了 的 重复 计算 , (ee REIHE. 最 后 的 程 订 多 多 少 少 路 
Hb RE 一 个 节点 仓储 高 度 时 复杂 。 如 采编 写 递归 程序 , PA AEE ES A A. 
此 是 ， 通 过 存储 平衡 因子 所 得 到 的 些微 隐 速 度 优 势 很 难 抵消 清晰 度 和 相对 向 明 性 的 损 拓 :不 
d 由 于 大 部 分 机 器 存储 的 和 最 小 单位 是 8 个 二 和 进 制 位 , 内 此 所 用 的 空间 量 洒 可 能 有 任何 
差别 。8 位 使 我 们 存储 高 达 255 的 绝对 沿 度 ， 既 然 树 是 平衡 的 ， 当 然 也 就 不 可 想像 这 会 少 到 
yn ao). 

i r CERE. 现在 准备 编写 AVL 树 的 - 些 例 程 。 不 过 , RT aa te. 其 
余 的 留 作 练习 。 首 先 , RIESE H, 这 些 上 启明 在 图 4-37 中 给 出 。 RA RPA 
的 测 数 来 返回 节点 的 高 度 。 这 个 萄 数 必须 处 理 NULL 指引 的 恼人 的 情形 .该 程序 在 图 4-38 [119 
中 给 出 ， 基 本 的 插入 例 程 写 起 来 很 容易 ， 因 为 它 主要 由 一 些 蝴 数 再 用 组 成 ( 见 峡 4-39) . 


F 


#ifndėf _AviTreg_H 


| struct AvlNode; 
typedef struct AviNode *Pos?tion; 
typedef struct AvINode *AviTree; 


l 
AvlTree MakeEmpty{ Avitreé T 33 

Position Find( ElementType X, AvlTree | j; 
Position FindMin( Avilrea T >: | 
| Position FindMax( AvlTreé T 3; 

| AvlTree Insert( ElementType X, AviTree T ): 
| AviTree Delete( ElementType X, AviTree T ); | 
| ElementType Retrieve( Position P 3; | 
| 


sendif /* _AviTree_H */ 
/* Place in the implementation file */ 
Struct AviNode 
| ElementType Etement: 
AvitTree Left: 


AvlTree Right; 
jnt Height: 


| h 


图 4.37 AVL PIRI cx po B8 


Poo, 


对 于 图 4-40 中 的 那些 树 ，SingleRetateWithLef 12/4539 BU Bk BIRT, IR Ei $8 fu] 
新 要 的 指针 , SingleRotateWithRight 做 的 于 作 恰好 在 到。 程序 在 图 4-41 PRE. 

我 们 要 写 的 最 后 一 个 丽 数 完成 图 4-42 PHETERUOUER , TEPRIT ERIS 4-33 A 

好 AVL. BEASBIER Ze ^P: pef A ee. Je RR HL ERE RTOG EE 2, Ze Tt REA E 
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好 的 策略 。 


Static int 
Height( Posttion P } 
1 


Tf P om NULL ) 


return -1; 
else 
return P->Height; 





图 4-38 iA AVL 节点 的 高度 的 函数 


AvlTree 
Insert( EtementType X, AvlTree T ) 


3fTC T == NULL 3 
i 
/* Create and return a one-node tree */ 
T = malloc( sizeof struct AviNode ) 3; 
iff T == NULL } 
Fatattrror¢ "Out of space!!!" 9; 
eise 
{ 
T->Element = X; T-»Height = 0; 
T-»Left = T-»Right = NULL; 
} 
} 
else 
if( X < T-»Element ) 


T->Left = Insert( X, T-»left ); 
if( Height( T-»Left ) - Height( T--Right ) == 2 J 
ift X < T-»Left--Element ) 
T = 5ingleRotateWithLeft( T "E 
else 
T = DoubleRotateWithLeft( T 5; 
} 
eise 
ifi X > T-»Element ? 
{ 
T-»Right = Insert( X, T-»Right M 
if Height( T-»Right ) - Height T-»Left ) == 2 ) 
if( X > T-»Right->Element ) 
T= SóngleRotatewithRight( T 5; 
else 
DoubleRotatewithRight( T 2; 


I E] 
/* Else X is in the tree already; we'll do nothing */ 


T--Height = Max€ Height( T-»teft ), Height( T-»Right 3 2 + li 
return T: 





图 439 E AVL Edi AD A3 BU e Xx 
E> E 
ky) 7 A 3 


A 2S AN LS 


图 440 单 旋转 


zu 


/* Perform a rotate between a node CK?) and its left child */ | 


p —————————————————M——— —— 
| /* This function càn be called only if K2 has a left child */ 
| /* Update heights, then return new root */ 


static Position 
SingleRotateWithLeft( Position K2 ) 


Position Kl; 


| Kl = K2->Left; 
K2->Left = Kl-»Right; | 
| Kl-»Right = K?; 
K2-»Height = Max( Height( K2->Left }, | 
Height K2-»Right ) 
Kl-»Height = Max( Height( Ki->Left }, K2-sHeight | 


urn Su 


return KL; A Mew root */ 








— 


图 4-41 执行 单 旋转 的 例 程 





图 4-12. 双 旋 转 





/* This function can be called only if K3 has a left */ 
/* child and K3's Jeft child has a right child */ 

/* Do the left-right double rotation */ 

/* Update heights, then return new root */ 


static Position 
DaubleRotatewithLeft( Position K3 J 
{ 
/* Rotate between K1 and K2 */ 
K3-»Left = SingleRotateWwithRightt K3-»Left ); 


| /* Rotate between K3 and K2 */ | 
return SingleRotatewithLeft( K3 5; 





图 4-43 ”执行 双 族 转 的 例 程 


4.5 伸展 树 


于 在 我 们 描述 一 种 相对 简单 的 数据 结构 ， 叫 向 伸 腻 树 (splay tree). EEAS PETERS TE 
BEBE M 次 对 树 的 操作 最 多 花费 〇 (CM log 以) 时 间 。 盟 然 这 种 保 让 并 不 排除 任意 一 次 操作 
EH ON) aya SI RE, 而 旦 这 样 的 界 也 不 如 每 次 操作 最 坏 情 形 的 界 O(log N Milk z 5i, 但 
中 实际 效果 十-- 样 的 ; 不 存在 坏 的 输入 序列 . ROR, 24 M KERE IEI E A n AE 
运行 时 间 为 DOOMEFCN)) 时 ， 我 们 就 说 它 的 捧 还 (amortizcd) 运 行 时 间 为 OLF(N))。 因 此 ,一 
棵 伸展 树 每 次 操作 的 摊 还 代价 是 O(log N). 经 过 一 系列 的 操作 之 后 ,有 的 可 能 花费 时 间 多 
-- 些 , 有 的 可 能 要 少 一 些 。 
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坏 ， 只 要 它 相对 不 党 发 生 就 行 。 任 何 一 次 访问 ,即使 花费 OCN), (ARERR. TRH 
找 树 的 问题 在 于 ,虽然 一 系列 访问 整体 都 有 可 能 发 生 不 良 操 作 , 但 是 很 罕见 。 此 时 ， 累 积 的 
运行 时 间 很 重要 。 具 有 最 坏 情 形 运 行 时 间 OCN) 但 保证 对 任意 M 次 连续 操作 最 多 花费 
OCM log N) 运 行 时 间 的 查找 树 数据 结构 确实 可 以 满意 了 ,因为 不 窒 在 坏 的 操作 序 询 ， 

如 果 任 意 特 定 操 作 可 以 有 最 坏 时 间 界 OUN) ,而 我 们 仍然 要 求 一 个 O(log N) 的 挫 述 时 
间 界 , 那么 很 清楚 ， 只 要 一 个 节点 被 访问 , TDI. DU, 一 已 我们 发 现 一 个 深层 
的 节点 ,我们 就 有 可 能 不 断 对 它 进行 Find 操作 。 如 果 这 个 节点 不 改变 位 置 ,而 每 次 访问 义 秦 
$t O(N), 那么 M 次 访问 将 花费 OL M:N) 的 时 间 。 

伸展 树 的 基本 想法 是 ， 当 一 个 节点 被 访问 后 , 它 就 要 经 过 一 系列 AVL 树 的 旋转 被 放 到 
根 上 。 注 意 , 如 果 一 个 节点 很 深 , 那么 让 其 路 径 上 就 存在 许多 的 节点 也 相对 较 深 , 通过 于 新 
构造 可 以 使 对 所 有 这 些 节 点 的 进一步 访问 所 花费 的 时 间 变 少 。 因 此 ,如 果 节 点 过 次 ,那么 我 
们 还 要 求 重 新 构造 应 具有 平衡 这 棵 树 { 到 某 种 程度 ) 的 作用 。 除 在 理论 上 给 出 好 的 时 间 失 外 ， 
这 和 圳 方法 还 可 能 有 实际 的 效用 , 因为 在 许多 应 用 中 当 一 个 节点 稚 访 问 时 ,， 它 就 很 可 能 不 久 南 
被 访问 到 。 研 究 表 明 , 这 种 情况 的 发 生 比 人 们 预料 的 要 频繁 得 和 多。 另外, 伸展 树 还 不 要 求 保 
留 高 度 或 平衡 信息 ， 因 此 它 在 某 种 程 庶 上 节省 空间 并 简化 代码 (特别 是 当 实现 蚀 程 经 过 审慎 
考虑 而 被 写 出 的 时 候 )。 
4.5.1 一 个 简单 的 想法 

实施 上 面 描述 的 重新 构造 的 一 种 方法 是 执行 单 旋转 , 从 下 向 上 进行 。 这 意味 着 我 们 将 在 
访问 路 径 上 的 每 一 个 节点 和 它们 的 父 节点 实施 旋转 。 作 为 例子 ,考虑 在 下 面 的 树 中 对 | 进 
行 一 次 访问 (一 次 Find) 之 后 所 发 生 的 情况 。 
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然后 ， 我 们 在 ki H k 之 加 旋转, (EI PRR, 


Z å C D 





这 些 旋转 的 效果 是 将 & 一 直 推 向 树 根 , 使 得 对 k 的 进一步 访问 很 容易 (暂时 的 )。 不 足 
的 是 它 把 另外 一 个 节点 (As3) 几 乎 推 向 和 e 以 前 同样 的 深度 。 疝 对 那个 节点 的 访问 又 将 把 妇 
外 的 节点 向 深 处 推进 , 如 此 等 等 。 虽 然 这 个 策略 使 得 对 e, 的 访问 花费 时 间 减 少 , 但 是 它 并 没 
有 基 显 地 改变 {原先 ) 访 问 路 径 上 其 他 节点 的 状况 事实 上 可 以 证 明 , 对 于 这 种 策略 将 会 仔 在 
一 .系列 M 个 操作 共 需 要 9 (M:N) 的 时 间 , 因此 这 个 想法 还 不 够 好 。 证 明 这 件 扣 最 简单 的 万 
法 中 考虑 向 初始 的 空 树 播 人 关键 字 1, 2.3. 000, N 所 彤 成 的 树 (请 将 这 个 例子 算出 ) EIC 
得 到 一 株 树 ， 这 标 树 只 由 一 些 左 儿 子 构成 。 外 于 建立 这 棵 树 前 其 花 费时 间 为 OCN), 因此 这 
未 必 就 有 多 坏 。 问 题 在 于 访问 关键 字 为 1 的 节点 花费 ,N 一 1 个 单元 的 时 间 。 在 这 些 旋转 元 
成 以 后 ,对 关键 字 为 2 的 节点 的 一 次 访问 花费 N 一 2 个 单 苑 的 时 间 。 依 这 访问 所 有 关键 二 
HUE BESI = Q(N?). 在 它们 都 被 访问 以 后 , 该 全 转变 加 原始 状态 , ARITE E 
复 这 个 访问 顺序 。 
4.5.2 展开 

时 开 fSplaying) 的 思路 类 似 于 前 而 介绍 的 旋转 的 想法 ,不 过 在 旋转 如 何 实施 上 我 们 稍 筱 
有 些 选 岩 的 余地 。 我 们 仍然 从 底部 向 上 沿 着 访问 路 径 旋转 : 令 X 是 在 访问 路 径 上 的 一 个 (于 
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AQ). 我 们 将 在 这 个 路 径 上 实施 旋转 操作 。 如 果 X 的 父 节 点 是 树 根 ,那么 我 们 只 要 旋转 
X 和 树 根 。 这 就 是 沿 着 访问 路 径 上 的 最 后 的 旋转 - 否则 ，X 就 有 父亲 (了) 和 祖父 (上 G), 存在 
两 种 情况 以 及 对 称 的 情形 要 考虑 。 第 一 种 情况 是 之 子 形 {(zig-zag) 情 形 ( 见 图 4-44). RE, X 
是 右 儿 子 的 形式 , P 是 左 儿 子 的 形式 (反之 亦 然 )。 如 果 是 这 种 情 帝 ,那么 我 们 就 执行 一 次 像 
AVL 那样 的 双 旋 转 。 否 则 ,出 现 另 一 种 一 字形 {zig-zig) 情 形 : X 和 PP RERE ES, MH 
都 是 右 几 子 。 在 这 种 情况 下 , 我 们 把 图 4-45 TARP ERRA ANH. 





图 4-44 之 字形 iZig-zag) 情 形 


(G) ON 
(P) = 
CREE 
AN AN SO 2 


126 图 4-45 一 字形 (Zig-zig) 情 形 


作为 例子 , 考虑 来 自 最 后 的 例子 中 的 树 , 对 & 执行 一 次 Find: 


展开 的 第 一 步 是 在 ,显然 是 一 个 之 字形 , 因此 我 们 用 ki Ro s 执行 一 次 标准 的 AVL X 
旋转 。 得 到 如 十 的 树 。 
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Tr e, REF PRE :个 一 字形 , 因此 我 们 用 上 、As 和 es 做 一 字形 旋转 . AEG IE - 


i 
A L "=. 


Ca OO. 


L DN c A 
A A LDN 

记 然 从 一 些小 例子 很 难看 出 来 , (Ee HR 4s XE DATED EE AR AR, m AR A 
RIEKE PAAR SP APRA ORR IP — EE PEDRO SP AEK) 

再 来 考虑 将 关键 字 为 1. 2,3, NAA SR ee. OB TE n] 
EVER OCN) 时 间 并 产生 与 一 些 简单 旋转 结果 相同 的 树 。 图 4-46 指出 在 关键 字 为 1 的 节 
点 展开 的 结果 .区 别 在 于 , 在 对 关键 字 为 1 的 节点 访问 (花费 N - 1 个 单元 的 时 间 ) 之 后 , 对 
关键 字 为 2 的 节点 的 访问 只 花费 N72 个 时 和 间 单 元 而 不 是 N 一 2 个 时 间 单 元 ; 不 存在 像 忆 前 
那么 深 的 节点 。 


(7) CT T CTS 
(f 6 (e ~ A 4 
X e 
9 — | ^ — “TY -一 M4 ^Y 
Meet Mou 
4 ol B" 2^ (5 
. X 
3 CTS £3 ^ 63^ 
- M 
e fT 
wor 


M446 在 节点 上 展开 的 结果 


对 关键 子 为 2 的 节点 的 访问 将 把 这 毕节 点 带 旬 距 根 NA 的 深度 范围 之 内 . 并 由 如 此 进行 下 
$ HARRE KHH log NUN = 7 的 例子 太 小 , 不 能 很 好 地 看 清 这 种 效果 )。 图 4.47 到 图 4-55 Yr 
示 在 32 个 节点 的 桂 中 访问 关键 字 1 到 9 的 结果 , 这 棵 树 最 初 只 含有 左 儿 子 ， 我 们 从 伸 尾 树 得 不 
到 有 简单 旋转 策略 中 常见 的 那 种 低 效率 的 坏 现象 。( 实 际 上 , 这 个 例子 只 是 一 -种 非常 好 的 情 帝 
有 -个 相当 复杂 的 证 朋 指 出 . 对 于 这 个 例子 ，N 次 访问 共 标 费 O(N) 的 时 间 .) 

这 些 图 普 重 强调 了 伸展 树 基 本 的 和 关键 的 特性 。 当 访问 路 径 太 长 而 导 臻 超出 正常 介 找 时 
间 的 时 候 , 这 些 旋转 将 对 木 来 的 操作 在 益 。 当 沪 问 耗 时 很 少 的 时 候 ， 这 些 旋 转 则 不 那么 有 益 
其 本 有 省。 极端 的 情形 是 经 过 若 下 插 人 而 形成 的 初始 树 。 所 有 Aud A FE e SC n] fe REED 
花费 常数 时 间 的 操作 。 此 时 , FRIAS - ERAROE RO RU. 查 是 运行 却 比 预计 的 快 、 从 面 总 的 
较 少 运行 时 间 补偿 了 损失。 这 样 ， 少数 摧 焉 麻烦 的 访问 孝 留 给 我 们 一 标 几 平 是 平衡 的 树 ， 其 
代价 是 我 们 必须 返还 其 些 已 经 省 下 的 时 间 。 我 们 将 在 第 11 章 证 明 的 主 此 定理 指出 ， 振 个 换 
作 绝 不 会 落后 O(log N) 这 个 时 间 ; 我 们 总 是 遵守 这 个 时 间 ， 即使 符 尔 有 些 不 良 操作 。 

我 们 可 以 通过 访问 要 被 删除 的 节点 实行 删除 操作 :- xx EbERADEETS A EES aD, BR 
除 该 节点 ， 则 得 到 两 棵 子 笠 T, Te AFT FED. MERIR 了 PM RAL 
GEAR. 那么 这 个 元 素 就 被 旋转 到 T, 的 根 下 , 而 此 时 Ty 将 有 一 个 没有 右 儿 子 的 根 。 
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图 4-49 ”将 前 面 的 树 在 节点 3 处 展开 
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我 们 可 以 使 Te 为 石 儿子 从 而 结束 删 陈 。 

对 伸展 树 的 分 析 很 困难 . 因为 树 的 结构 经 常 变化 。 另 - 方面 , 伸展 树 的 编程 要 比 AVL 
竺 简单 得 多 , 这 是 因为 要 考虑 的 情形 少 并 且 没 有 平衡 信息 需要 存储 。 实 际 经 验 指出 , 在 实践 
四 它 可 以 转化 成 更 快 的 程序 代码 , 不 过 这 种 状况 还 远 非 完美 ， 最后, 我 们 指出 , PRE TIL 
种 变化 , 它们 在 实践 中 甚至 运行 得 更 好 、 有 一 种 变化 在 第 12 BPR RPA. 
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图 4-55 A A OE 1 a 9 ART 
4.6 Bii 
sro BH BERT HEY, 因而 按照 排序 的 顺序 列 出 所 有 的 关键 字 会 很 篇 
8&, 图 4-56 中 的 递归 过 程 就 是 进行 这 项 工作 的 。 


void 
PrintTree( Searchiree T ) 


ifC T !- NULL } 


PrintTree( T-»Left 3; 
PrintElement( T-»Element 1; 
PrintTree( T->Right ); 

】 


} 





4-56 按 顺 序 打印 二 叉 查 找 持 的 例 程 


毫 无 疑问 , 该 过 程 能 够 解决 将 关键 字 排序 列 出 的 问题 。 正 如 我 们 前 面 看 到 的 , 这 类 例 程 
当 用 到 树 上 的 时 候 则 称 为 中 序 遍 历 ( 由 于 它 依 序列 出 了 关键 字 , AURA). PEED 
的 一 般 策 略 是 首先 遍历 左 子 树 , 然后 是 当前 的 节点 , 最 后 遍历 右 子 树 。 这 个 算法 的 有 趣 部 分 
除 它 简 单 的 特性 外 , 还 在 于 其 总 的 运行 时 间 是 O(N)。 这 是 因为 在 树 的 每 一 个 节点 处 进行 的 
工作 都 是 常数 时 间 的 .每 一 个 节点 访问 一 次 ， 而 在 每 一 个 节点 进行 的 工作 是 检测 是 否 
NULL. 建立 两 个 过 程 调用 并 执行 PrintElement。 由 于 在 每 个 节点 的 工作 花费 常数 时 间 以 及 
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ARA N 个 节点 ,因此 运行 时 间 为 O(N)， 

有 时 我 们 各 要 先 处 理 黄 个 子 树 然 后 才能 处 理 当 前 节点 例 旭 ,为 了 计算 - 个 节点 的 高 
Et. 我 们 需要 知道 它 的 两 棵 子 树 的 高 度 ， 图 4-57 中 的 程序 就 是 计算 高 度 的 ”由 于 检查 一 些 
特殊 的 情 沈 总 是 有 益 的 一 一 当 涉 太 递 上 时 尤其 重要 ， 内 此 要 注意 这 个 例 程 上 启明 树叶 -的 陋 度 为 
毒 ,这 是 正确 的 这 种 一 般 的 侦 历 脑 序 叫做 后 庆 遍 历 , 我 们 在 前 面 也 见 到 过 因为 在 每 个 节 
点 的 工作 花 绚 常数 时 间 ， 折 以 总 的 运行 时 间 也 是 OCN). 

我 们 多 过 的 第 一 种 常用 的 幅 历 格式 力 先 序 遍 厉 (fpreorder traversal). iX B. 当前 他 点 在 其 
儿子 节点 之 前 处 理 .， 这 种 遍历 可 以 用 来 利用 节点 深度 标志 仁 - UTR ue 





int 
Height( Tree T 5 
i 
1f€ 1 == NULL 3 
return 1; 
else 
return 1 + Maxi Height( T-»Left 3, 
| Height( T-»RKight > 3; 


[£f 4.57 ERG Ei TE RHR eae 


所 有 这 些 例 程 有 一 个 共有 有 的 想法 , ARE SE FE Rb NULL 的 情形 , ind a aR BY IT. 
A: 注意 , 此 好 缺 少 一 些 额 外 的 变量 。 这 些 例 程 仅仅 传递 了 树 ， 并 没有 玛 明 或 是 传递 什 们 向 
bE EFRA, 一 些 感 大 的 错误 出 现 的 可 能 就 越 小 、 第 四 种 避 历 用 得 很 少 . ULLA 
JPR J Clevel-order traversal}, 我 们 以 前 尚 林 见 到 过 ， 在 屋 BAY, WERE D Ae 
在 深度 D1 1 ARATE. RF GRR S TELE 877 fe Pe EENH 
地 实施 的 ; 它 用 到 队列 ,i 不 使 用 递 轨 所 默 示 的 栈 。 
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虽然 泡 今 为 止 我 们 所 看 到 的 查找 册 都 是 二 义 树 ,但 是 还 有 一 种 常用 的 查找 锁 不 是 一 尽 
树 ， 这 种 树 吧 做 B-BI(D-tree) a 

阶 为 M 的 B- 树 是 一 棵 具有 下 列 结 移 特 性 的 树 ， 

。 树 的 根 或 者 是 一 - 片 树叶 , 或 者 其 儿子 数 在 2 和 M Zij 

。 除根 外 ,所 有 非 树 叶 节 点 的 儿子 数 在 ' M /2 | 和 M 之 闻 。 

。 所 有 的 树叶 都 在 相同 的 深度 上 。 

所 有 的 数据 都 存储 在 树叶 上 .在 每 一 个 内 部 节点 上 篆 含 有 指向 该 节点 各 儿子 的 指针 Pj， 
Pay vias Py 和 分 别 代 表 在 子 树 PS, Ps, , Pay te HA EU VRE TAL RI. kos oe. 
ky jo 当然, 可 能 有 些 指针 古 NULL, 而 其 对 应 的 p 则 是 未 定义 的 ， 对 于 每 一 个 节点 ,其 
do Py) 中 所 有 的 关键 字 都 小 于 子 树 P 的 关键 子 ， 如 此 等 等 。 树叶 包含 所 有 实际 数据 ， 这些 
数据 或 者 是 关键 字 木 身 , 或 者 是 指向 含有 这 些 关 键 了 的 记录 的 指针 为 使 例子 简单 ,我 们 将 
借 设 为 前 者 。B- 树 有 多 种 定义 ,这 些 定义 在 - - 些 次 变 的 细节 上 不 同 于 我 们 定义 的 结构 不过， 
RITE MAI BA A. (为 一 — fap 4 AY SS HY IE Se Re a PE, the 
pide aS E. peli TE ASRS FABRE ) 我 们 1 xk Cg TE (GE AD H 


12 
lis 图 4-58 中 的 树 基 4 阶 B 树 的 一 个 例子 。 


de plige 


i 叶 中 关键 字 的 个 数 也 在 | M /2 PRIM 之 间 。 
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4 Br B 树 更 流行 的 称呼 是 2-3-4 树 , 而 3 阶 B- 树 叫做 2-3 树 。 我 们 将 通过 2-3 树 的 特殊 情 
JE X fxh B 树 的 操作 。 现 在 从 下 面 的 2-3 树 开 始 。 





我 们 用 椭圆 画 出 内 部 节点 ( 非 树 叶 )， 每 个 节点 含有 两 个 数据 。 椭 网 中 的 短 模 线 表示 内 部 
节点 的 第 二 个 信息 , 它 表 明 该 节点 只 有 沽 个 儿子 。 树 叶 用 方 框 画 出 , 框 内 含有 关键 字 。 树 叶 
中 的 关键 字 是 有 序 的 。 为 了 执行 一 次 Find, 我 们 从 根 开始 并 根据 要 查找 的 关键 字 与 存储 在 节 
点 十 的 两 个 (很 可 能 是 一 个 ) 值 之 间 的 关系 确定 (最 多 ) 三 个 方向 中 的 一 个 方向 。 
为 了 对 尚未 见 过 的 关键 字 XX 执行 一 次 Insert, 我 们 首先 按照 执行 Find 的 步骤 进行 。 当 到 
大 一 片 树叶 时 , RRRA TAA X 的 正确 的 位 置 。 例 如 , 为 了 插 人 关键 字 为 18 的 节点 ,我 
134] 们 可 以 就 把 它 加 到 一 片 树叶 上 而 不 破坏 2-3 树 的 性 质 。 插 人 结果 表示 在 下 列 图 中 。 





Au. 由于- : 片 怪 呈 具 能 容纳 两 个 或 一 个 大 键 闻 ,因此 上 面 的 做 法 不 总 是 可 能 的 。 如 果 
我 们 现在 试图 把 上 插 人 到 树 中 去 , 那么 不 会 发 现 1 所 属于 的 节 上 已 经 满 了 - 将 这 个 新 的 关键 
字 放 人 该 方 点 使 得 它 有 了 四 个 关键 字 , 这 是 不 允许 的 。 解决 的 办 法 是 , PARRA SA. BET 
节点 有 两 个 关键 子 , 同时 调整 它们 父 节 点 的 信息 , 3n PE]. 





ATN 
m ls Gus L | | , -一 
11, 12 16, L7, 18! 22, 23, 31 | 41,52 | (58, 59. 41 
-ua LY >] | MEN] 78, 59. 6 


然而 ,这 个 想法 也 不 总 能 够 行 得 通 , 我 们 尝试 将 19 插 和 到 当前 的 树 中 时 就 会 看 出 问题 。 
A ADEST TUR, 每 个 节点 有 两 个 关键 字 , WARME IR, 
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xc 68 — PRESS T FIAROL-T, SIRT ARIE EB STL FP. SERO 
很 简单 。 我 们 只 要 将 这 个 节点 分 成 黄 个 节点 ， MAMMA 当然 . 这 个 节点 本 号 
可 能 就 是 三 个 儿子 节点 之 一 , 而 这 样 分 型 该 入 点 将 给 它 的 父 节点 带 来 一 个 新 闻 题 (该 父 市 A 
PPT IL). 但 是 我 们 可 以 在 通 向 UB EER 12 — ovens BMRA ARTA, 
成 者 找到 一 个 节点 ， 这 个 节点 只 有 两 个 儿子。 在 我 们 的 例子 中 , 通过 用 分 裂 节 点 的 方法 我 们 
只 能 到 达 所 见 到 的 第 一 个 内 部 节点 ,得 到 如 下 的 树 。 





旭 打 现在 播 和 关键 字 为 28 的 一 个 元 素 , 那么 就 会 出 现 一 片上 由 有 四 个 儿子 的 树叶 ， urn 
Sy HH OE, SEIT PATIL 


100 HAE 





eS 58:27 
Ls asia 


这 样 ， 又 产生 一 个 具有 四 个 儿子 的 内 部 节点 ,此 时 它 被 分 成 两 个 儿子 节点 。 我 们 这 里 做 
[136] 的 就 是 把 根 节点 分 成 两 个 节点 。 这 个 时 候 , 我 们 得 到 一 个 特殊 情况 , 通过 创建 一 个 新 的 根 节 
ARITE ASE 28 的 插 人 。 这 是 2-3 树 增加 高 度 的 ( 惟 一 ?方法 。 





(22, 23| [28,31 n. 52 ps. 59. 61! 


还 要 注意 ,当权 人 一 个 关键 字 的 时 候 ， 只 有 在 访问 路 径 上 的 那些 内 部 节点 才 有 可 能 发 生 
变化 。 这 些 变化 与 这 条 路 径 的 长 度 成 比例 ; 但 是 要 注意 , 由 于 需要 处 理 的 情况 相当 多 , 因此 
很 容易 发 生 错 误 。 

对 于 一 个 节点 的 儿子 太 多 的 情况 还 有 一 些 其 他 处 理 方法 ,而 我 们 刚才 描述 的 方法 八 幅 起 
最 简单 的 情况 。 当 试图 将 第 四 个 关键 字 洪 加 到 一 片 宕 叶 上 的 时 蛋 , 我 们 可 以 首先 查找 只 有 两 
个 关键 字 的 兄弟 , 而 不 是 把 这 个 节点 分 裂 感 两 个 。 例 如 , 为 把 TO 添 吉 到 上 面 的 树 中 , 我 们 可 
以 把 ss 挪 到 包含 有 41 和 52 的 树叶 中 , 再 把 70 与 59 061 放 到 一 起 , 并 调整 一 些 内 部 节操 
中 的 各 项 。 这 个 策略 也 可 以 用 到 内 部 节点 上 并 尽量 使 更 多 的 节点 具有 足够 的 关键 字 。 这 种 方 
法 使 得 例 程 的 编制 稍微 有 些 复杂 , 但 是 浪费 的 空间 较 少 。 

我 们 可 以 通过 查找 要 被 删除 的 关键 字 并 将 其 除去 而 完成 删除 操作 。 如 果 这 个 关键 字 是 一 个 
节点 仅 有 的 两 个 关键 字 中 的 一 个 , 那么 将 它 除去 后 就 只 剩 一 个 关键 字 了 。 此 时 我 们 可 以 通过 把 
这 个 节点 与 它 的 一 个 兄弟 合并 来 进行 调整 。 加 果 这 个 几 征 已 有 3 个 关键 字 , 那么 我 们 可 以 从 中 
取出 一 个 使 得 两 个 节点 各 有 两 个 关键 字 。 如 果 这 个 兄弟 只 有 两 个 关键 字 , 那么 我 们 就 将 这 两 个 
节点 合并 成 一 个 具有 3 个 关键 字 的 节点 。 现 在 这 个 节点 的 父亲 则 失去 一 个 儿子 ， 因此 我 们 还 须 
向 上 检查 家 到 顶部 。 如 果 根 节点 失去 了 它 的 第 二 个 儿子 ， 那么 这 个 根 也 变 删 除 ， 而 树 则 减少 于 
_ 层 。 当 我 们 合并 节点 的 时 候 , 我 们 必须 记 住 要 更 新 保存 在 这 些 内 部 节点 上 的 信息 。 
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MF AR MBR, HA ARRE FOI. TE AYA AE ACE EE AT 
经 具有 M PRES OIE. 这 个 关键 字 使 得 该 节点 具有 M 1 1 PORES. 我 们 可 以 把 它 分 裂 
pA a. cef SUR CM! 1/2. AL OM 4 1)72j 个 美 键 字 .由 于 :这 使 得 从 节点 多 出 一 
个 儿子 、 因 此 我 们 必须 检查 这 个 节点 是 否 可 被 父 节 点 接受 ， 则 采 父 六 点 已 经 具有 M PL, 
那么 这 个 父 节 点 就 要 被 分 裂 城 两 个 委 点 .我 们 重复 这 个 过 程 正 天 找到 -一 个 父 节 上 总 共有 少 于 
M 个 儿子 如果 我 们 分 戏 根 节点 , 那么 我 们 就 些 创 建 一 个 新 的 根 . 这 个 要 有 两 个 儿 于 ， 

B- 树 的 深 典 最 多 是 [ log yo N 1。 和 在 路 共 虐 的 每 个 节点 ,我 们 执行 Oog MWER T. fF 
虹 坟 确定 选择 哪个 分 二 (使 用 折 半 查找 ), (OLE Insert 和 Delete 可 能 需要 OC MAUL PPAR VÀ 
刺 该 节点 下 的 所 有 信息 ， 因此， 对 于 每 个 Insert Al Delete 运算 、 HI AS TÉ By is TIBERI AJ 
OOM logy N) = O(CM Aog M) log N). 不 过 -次 Find 只 花费 Otiog NATAL. 经验 折 出 . 
MZA, M 的 最 好 (合法 的 ) 选 择 是 M = 3 或 M - 4, ix 5 EIAS XX. ETS 
出 . 当 M4 再 增 大 时 插入 各 删除 的 时 间 就 会 增加 ， 如果 我 们 只 关心 主 存 的 速度 , HUS gs Bry 
让 树 {如 5-9 BO ERR TE ADEST. 

B 树 实际 用 于 数据 库 系 统 , 在 那 虹 权 散 存储 在 物理 的 磁盘 上 而 不 是 主任 中 ;一般 说 来 ， 
对 态 稻 的 访问 要 比 任 何 的 主 存 操 作 慢 几 个 数 晨 级， 如 果 我 们 使 用 M Br BBY. AB AR SETS S] 
HEUS Ologu N)。 虽 然 每 次 磁盘 访问 化 费 O(log MI) 来 确定 分 支 的 方 站 , 但 是 执行 该 操作 
的 时 间 一 般 要 比 读 存 储 器 的 区 块 (block) 所 化 费 的 时 间 少 得 多 、 内 此 可 以 被 认为 是 无 忠 轻 里 的 
(Re M 选择 得 人 台 理 )。 即 使 在 每 个 节 忆 执行 更 新 此 花费 OC MPEP ETI, 这 些 人 花费 一 般 还 
是 不 大 ， 此 时 M 的 值 选择 为 个 得 一 个 内 部 他 点 仍然 能 够 装 和 一 个 矿 瘟 区 块 的 最 大 值 ， 那么 
它 - - 般 说 来 是 在 325° M0256 范围 内 、 选择 存储 在 一 片 科 叶 上 的 元 束 的 最 大 个 数 时 ,更 俩 得 
如 果树 叶 是 满 的 那么 它 就 装 满 一 个 区 块 。 这 意味 着 ， 一 个 记录 总 可 以 在 很 少 的 磁 量 访问 小 被 
找到 ,因为 典型 的 B- 树 的 深度 只 有 2 或 3， 而 根 (很 可 能 述 有 第 层 ) 可 以 放 在 十 存 小 ， 

分 析 指 出 , 一 棵 BRE RHE In 2 = 6995. CH BEMEG SUI BS CM + 1) 项 时 , GE 
是 改 去 分 型 节点 ,而 是 搜索 能 够 接纳 新 儿子 的 兄弟 ,此 时 我 们 就 能 够 更 好 地 利用 空间 -其 体 
的 细节 可 以 在 参考 文献 中 找到 - 


总 结 


Sell Jo LEEPER RSE. PERL A APPR PU. RAAR EE — ES TALI 
所 调 的 分 析 树 (parse trec) f— MAT, SHIT AUER PRIETO EUR. A 
1E URP, MARKERER AOE FECAL, 建 六 分 析 树 的 算法 却 不 是 那么 简单 )、 

舍 找 树 在 算法 设计 中 是 非常 重要 的 。 它 们 几乎 友 持 所 有 有 用 的 操作 ,而 其 对 数 平 均 开锁 
很 小 、 查 找 树 的 非 递归 实现 多 少 要 快 一 些 , 但 是 递归 实现 更 讲究 .更 精彩 . mA TEUER 
除 钙 ， 在 找 树 的 问题 在 于 ,共性 能 严重 地 依赖 十 输入 , 而 输入 则 基 随 机 的 。 如 困 情 沈 个 左 这 
样 , 则 运行 时 间 会 显著 增加 . eder coke RE 

我 们 见 到 了 处 理 这 个 问题 的 儿 个 方法 。AVL PEORIA WA TS PTE a E 
相差 最 多 是 1。 这 就 保证 了 树 不 至 于 太 深 。， 不 改变 树 的 操作 都 可 以 使 用 标准 二 又 查找 树 的 秦 
Hi 2 AR ht ES ED DECRE REL. CEP IERI, RA RT. REGE T TE k 
O(log N) 的 时 间 插 人 后 如 何 将 树 恢复. 


138, 


一 —À 


102 £43 





我 们 还 考察 了 伸展 树 。 在 伸展 树 中 的 结 点 可 以 达到 任意 深度 , 但 是 在 每 次 访问 之 后 树 又 
以 多 少 有 些 神 秘 的 方式 被 调整 。 实 际 效果 是 , 任意 连续 M 次 操作 花费 口 (M log NOI, € 
与 平衡 树 花 费 的 时 间 相 同 。 

与 2- 路 树 或 二 丸 树 不 同 , B 树 是 平衡 M- 路 树 ， 它 能 很 好 地 匹配 磁盘 : 其 特殊 情形 是 2-3 
E, 它 是 实现 平衡 查找 树 的 男 一 种 证 用 方法 。 

在 实践 中 ， 所 有 平衡 树 方案 的 运行 时 间 都 不 如 简单 二 叉 查 找 树 省 时 ( 差 一 个 弟 数 因子 )， 
伯 这 一 般 说 米 是 可 以 接受 的 , 它 防 止 轻 易 得 到 最 坏 情 形 的 输入 。 第 12 THO AI BAR 
树 数据 结构 并 给 出 详细 的 实现 方法 。 

BREE: 通过 将 一 些 元 察 插 和 人 到 查找 树 然 后 执行 一 次 中 序 遍 历 , 我 们 得 到 的 是 排 过 序 
的 元 素 。 这 给 出 排序 的 一 种 O(N log N) 算 法 , 如 果 使 用 任何 成 熟 的 查找 树 则 它 就 是 最 坏 铺 
形 的 界 。 我 们 将 在 第 7 章 看 到 一 些 更 好 的 方法 , 不 过 , 这 些 方 法 的 时 间 界 都 不 可 能 更 低 。 


练习 


问题 4.1 到 4.3 参考 图 4-59 中 的 树 . 
4.1 对 于 图 4-59 中 的 树 ， 
a. Br EAR? 
b. Bpse s cce Bu rp? 
4.2 对 于 图 459 中 树 上 的 每 一 个 节点 : 
a. 指出 它 的 父 节 点 。 
b. WHENF TA. 
c. JI ERLE PS 
d. HARERRRE. 
e. 计算 它 的 商 度 。 
4.3 图 4-59 中 树 的 深度 是 多 少 ? 





Pe] 4-59 


4.4 证 明 在 N 个 节点 的 二 丸 树 中 , 存在 N + 1 个 NULL 指针 代表 六 + LUFT. 

4.5 证 明 在 高 度 为 日 的 二 叉 料 中 ,节点 的 最 大 个 数 是 27 01 1 

4 6 3% (full node) 是 具有 两 个 几 子 的 节点 。 证 明 满 节点 的 个 数 加 1 等 于 非 空 二 又 树 的 树 
叶 的 个 数 。 
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47 BOARA REN d. ... hy. Er PH OF BY BRE TE ER di. di. .... diro 证明 . 
NIV 24 < 4 并 确定 何 时 等 写成 六 。 
4.8 给 出 对 应 国 4-60 ASA RAGA US | SR Pea CV A aR ETAT 


o 
T ^ 
G iO 
- / 
Hog b cf d 


Mia-50 el 4.8 Ase 


4.9 a 指出 将 3，1，, 4.6.9, 2, 5, 7 特大 到 初始 为 空 的 一 叉 朝 找 树 中 的 统 林 . 
b. T8 CHAIR i Ha AR 

4.10 好 出 实现 基 林 二 义 查找 树 操 作 的 葬 程 ， 

4.11 使 用 类 似 于 指针 链表 实现 法 的 策略 ,可 以 用 指针 实现 . 义 查 找 树 ”使 用 指针 实现 方 
法 写 出 基本 的 二 义 查 找 树 例 程 : 

4.12. PRR SESS OLE ER BEAL Insert/Delete 操作 对 可 能 引起 的 问题 。 这 里 有 AR, 
它 不 是 完全 随机 的 ,但 却 是 足够 封闭 的 。 通 过 插入 从 1 到 M= oN 之 加 随机 选 抽 的 NN 个 


TEKET- N 个 元 素 的 梧 。 然 后 执行 N? 对 先 插入 后 删除 的 灌 作 。 假 设 存在 例 “一 


fi RandomInteger(A,B).EiREI—ME A M B 之 间 ( 包 括 A BIKES LZ 
4a， 和 解释 如 何 生成 在 1 和 邮 之 间 的 -- 个 随机 整数 ,该 整数 不 在 这 棵 树 上 (从 而 了 硕 机 捕 
人 可 以 进行 )， FAN 和 a 来 表示 这 个 操作 的 运行 时 间 ， 
b. 解释 如 合生 成 在 1 和 M 之 间 的 一 个 随机 整数 ,该 整数 已 经 存在 于 这 梯 树 上 (从 
而 随机 删除 可 以 进行 )}。 这 个 操作 的 运行 时 间 基 多 少 ? 
c. a 的 最 佳 选 择 俏 是 多 少 ? 为 什么 ? 
413 编写 一 个 程序 , 赁 经 验 估计 删除 具有 两 个 子 节点 的 下 列 各 方法 : 
a. HOT, 中 最 大 节点 XX 来 代替 , 递归 地 删除 X. 
b. 交替 地 用 Ty, 中 最 太 的 节点 以 及 Tr aen FP HEH RS AIRE 3 s 
c. eis. T, 中 最大 的 节点 或 -Tk PRAAT ARRE OR IE D A Rak ST 
As ， 哪 种 六 法 给 出 最 好 的 平衡" sh Ais mae UATE FE List Fe ETE R a 
RR 
4.14. 证 明 , BAL RT ROE CRE 0 8 LESER BEES] D. O (log. N): 
24.15 a. ubi EO H M AVL BIBS Vio ideo TCR ACA - 
b. EX 15 的 AVL 树 中 季 点 的 最 少 个 数 是 多 少 ? 
4.)6 onion 4, 5,9, 3, 6, 7 插入 到 初始 空 AVL REMAR 
4.7 (ORIS AGREE 1.2, 闪 - LR ASI PREIS AVL m HESH Br 48 Bl ES p E 
完全 平衡 的 : 


I 00 £a 


4.18 写 出 实现 AVL 单 旋转 和 双 旋 转 的 其 余 的 过 程 。 

4.19 HAA AVL BESETTAR A BUHESÉ V AR 

«4.20 ”如 何 能 够 在 AVL 树 中 实现 ( 非 懒 信 删除? 

4.21 a. 为 了 存储 一 棵 NN 节点 的 AVL 树 中 一 个 节点 的 高 度 , 每 个 节点 需要 多 少 比 特 (bit)? 
b. 使 8 比特 高 度 计 数 器 洪 出 的 最 小 AVL 树 是 什么 ? 

4.22 ” 写 出 执行 双 旋 转 的 函数 ,其 效率 要 超过 执行 两 个 单 旋 转 . 

4.23 指出 依 序 访问 图 4-61 中 的 伸展 树 中 的 关键 字 3, 9, 1, 5 后 的 结果 。 





图 4-61 


4.04 ”指出 在 前 一 道 练习 所 得 到 的 伸展 树 中 删除 具有 关键 字 6 MUR aa. 
4.25 由 节点 1 直到 N = 1024 BR —BR EU ZEJL- RR 
a. 该 树 的 肉 部 路 径 的 长 准确 地 说 是 多 少 ? 
«b. 在 执行 Find(1), Find(2), Find(3), Find(4), Find(5), Find(6) 每 一 个 之 后 计算 
肉 部 路 径 长 。 
cc MRABAT HI Find 是 连续 的 , 那么 什么 时 候 内 部 路 径 长 达到 最 小 ? 
4.26 a. 证明, 如果 在 一 棵 伸展 树 中 按照 顺序 访问 所 有 的 节点 , 那么 所 得 到 的 结果 是 由 一 
ERA ILS AMAT. 
wb. 证 明 ,如果 在 一 棵 伸展 树 中 按 顺 序 访问 所 有 的 节点 ,那么 若 不 考虑 初始 树 ， 则 总 
的 访问 时 间 是 O(N)。 
427 ”编写 一 个 程序 对 伸展 树 执行 随机 操作 。 计 算 对 序列 执行 的 总 的 旋转 次 数 。 3 AVL 
树 和 非 平 衡 二 叉 查 找 树 相 比 ， 共 运行 时 间 如 何 ? 
4.28 ”编写 一 些 高 效率 的 函数 ,只 使 用 指向 二 叉 树 的 根 的 一 个 指针 T, 并 计算 : 
a. 工 中 节点 的 个 数 。 
b. T 中 树叶 的 片 数 - 
c,， 工 中 满 节点 的 个 数 。 
4.29 写 出 生成 一 棵 N 节点 随机 二 又 查找 树 的 函数 , 该 树 具有 从 1 直到 N 的 不 同 的 关键 
字 。 你 所 编写 的 例 程 的 运行 时 间 是 多 少 ? 
4.30 宇 出 生成 具有 最 少 节点 、 高 度 为 H 的 AVL 树 的 程序 , 该 函数 的 运行 时 间 是 多 少 ” 
| aai 编写 一 个 函数 , 使 它 生成 -- 棵 具有 关键 字 从 LEA 2- 1AA H 的 理想 平衡 
142| ZILARRA WowwGaefr Bee? 


4.32 编写 一 个 函数 以 . . 义 查 找 村 T 和 两 个 有 序 的 大 键 字 &| M klk EBD YE WRIA, dT 


4 


I 


p 


b b È 


f 105 


印 树 中 所 有 满足 BIELKey(X)snk. BTA Xe 除去 可 以 排序 证. 不 对 关键 字 的 类 型 
做 任何 息 设 。 所 全 的 程序 应 该 以 平 区 时 间 OLK + dog NJ 运行, 其 中 KK 是 所 打印 
的 关键 字 的 个 数 ， 确 定 你 的 算法 的 运行 时 间 界 . 


33 本章 直 一 些 更 大 的 - ATR: PREP Oo, RT Le 8E T Y 


指定 坐标 (rz，v)， 围 绕 每 个 坐标 画 一 个 圆 痢 ( 在 某 些 网 片 中 这 可 能 很 难看 清 )}， 并 将 

AP PARENTAL. REETA RA AE RAR RITA LA 

a5 — SEE HE n 85 ER Bg TI SS FEB EER o 

a. 坐标 x ADRS PRR BORE. 3-H PRE BL 

b. rR 可 以 通过 使 用 节点 深度 的 相反 数 算 出 。 对 于 树 中 的 每 :个 节点 写 出 这 样 的 
例 程 。 

c. 若 剑 用 其 个 虚拟 的 单位 表示 , 则 所 务 图 形 的 具体 尺寸 是 多 少 ” 如 何 调 稚 单 位 使 得 
所 曙 的 树 总 是 高 大 约 为 澳 的 三 分 之 二 ? 

d. WEB, 使 用 这 个 系统 没有 交 交 线 出 现 , ad, 对 于 生意 节点 X. X 的 左 子 树 的 所 
有 元 素 部 出 现在 X 的 左边 ，X 的 丰 了 于 树 的 所 有 元 素 都 囊 现 在 义 E. 


,34 编写 -个 一 般 的 画 树 程序 , 该 程序 将 把 一 棵 树 转变 成 下 列 的 图 -组 次 折 令 : 


a, Circle(X, Y) 

b. DrawLine(i. j) 

第 .个 指令 在 (外 ，Y} 处 画 一 个 圆 , 而 第 二 个 指令 则 连接 第 i 个 圆 和 第 j 个 圆 ( 圆 以 

所 画 的 顺 译 编号 )。 你 或 者 把 它 汪 成 一 个 程序 并 定义 某 种 输入 语言 ,或 者 把 它 马 成 
.个 函数 ,该 函数 可 以 被 什 何 程序 调用 : 你 的 程序 的 运行 时 间 是 多 少 ? 


35 编写 一 个 例 程 以 层 序 {level-order) 列 出 二 叉 树 的 节点 : 先 列 出 根 ， 然 后 列 出 深度 为 1 


的 那些 节点 , 再 列 出 深度 为 2 的 节点 , 等 等 。 必 须要 在 线性 时 间 内 完成 这 个 工作 。 
TEAR PR AED Tal FF. 


.36 a. 指 站 将 下 列 闫 键 字 插入 到 初始 空 2-3 树 后 的 结果 ; 3, 1, 4, 5, 9, 2, 6, 8, 7, 0. 


b. 指 电 在 Ca) 建立 的 2-3 树 中 删除 0, 然后 再 删除 9 所 得 到 的 结 


.37、a. 写 出 向 一 棵 BASE AHA 


cb. BM REBAR IE, 26 — OR BSR, 是否 要 更 新 站 部 下 
点 的 信息 ? 

.修改 你 的 播 人 例 程 使 得 姐 果 想 要 向 一 个 已 经 有 M 项 的 节点 洪 加 元 紊 ， Wide 4p 
ix) AW EAT READ M 个 儿子 的 兄弟 的 工作 。 


.38 MB B* ACB" -trce) EH BET ABE 1r a JL RE 2M 73 Fl M = aA BAY. $t 


Jh B" 树 进 行 插 人 的 方法 . 


39 ”指出 如 何 用 儿子 /兄弟 指针 实现 方法 表示 图 4-62 中 的 树 . 


.40 ”编写 -个 过 程 使 该 过 程 遍 访 一 株 用 儿 芋 7 兄弟 链 人 存储 的 桶 
Al 如果 两 棵 一 叉 树 或 者 都 是 空 树 ， 或 者 非 空 瑟 只有 相似 的 左 子 树 和 石子 俩 ， 则 这 两 标 
二 义 树 是 相似 的 。 编 写 一 个 函数 以 确定 是 否 两 棵 二 叉 树 是 相似 的 。 
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Fl 4-62 练习 4,39 中 的 树 


4.42 如 果树 Ti 通过 交换 其 ( 某 些 ) 节 点 的 左右 儿子 变换 成 树 T. MERRI T, 和 了 是 同 
#449 (isomorphic), Bilal, 图 4-65 中 的 两 棵 椅 是 同 构 的 ,因为 交换 A. B. G 的 儿子 
而 不 交换 其 他 节点 的 儿子 后 这 两 棵 树 是 柜 同 的 。 
a. 给 由 一 个 多 项 式 时 间 算 法 以 决定 是 否 两 棵 树 是 同 构 的 。 
*b. 你 的 程序 的 运行 时 间 是 多 少 (存在 一 个 线性 的 解 奖 方案 吗 )5 





L144| 图 4-63 两 棵 同 梅 的 树 


4.43 «a. 证 明 , 经 过 一 些 AVL 单 旋转 , 任意 二 叉 查 找 树 工 | 可 以 变换 成 另 一 棵 (县 有 相 
ES EAR Too 
xb. 给 出 一 个 算法 平均 用 O(N log N) 次 旋转 完成 这 种 变换 。 
c 证 明 该 变换 在 最 坏 的 情形 下 可 以 用 O(N) 次 旋转 完成 。 
4.44” 设 我 们 想 要 把 运算 FindKth 添加 到 指令 集中 去 。 沪 运算 FindKth(T, i) 返回 树 T 
的 具有 第 i 个 最 小 关键 字 的 元 案 。 假 设 所 有 的 元 察 具有 瑟 异 的 关键 字 。 解 释 如 何 修 
改 二 叉 树 以 平均 O(log N) 暑 间 支 持 这 种 运算 ， 而 又 不 影响 任何 其 他 操作 的 时 间 界 。 
4.45 由 于 具有 N 个 节点 的 二 叉 查 找 树 有 NN + 1 个 NULL 指针 , 因此 在 二 叉 查找 树 中 指 
定 给 指针 信息 的 空间 的 一 半 被 浪费 了 。 设 若 一 个 节点 有 一 个 NULL ALY, 我 们 
EERE JLT EE MPATE (inorder predecessor), 车 一 个 节点 有 一 个 NULLA 
儿子 , 我 们 让 它 的 右 儿 子 指向 它 的 中 组 后 继 (inorder successor)» 这 就 叫做 线索 对 
(threaded tree), Te RA BUSS Et RU Ae A (thread) a 
a 我们 如 何 能 够 从 实际 的 儿子 指针 中 区 分 出 线索 ? 
b. 编写 执行 向 由 上 面 描述 的 方式 形成 的 线索 树 进行 持 人 和 删除 的 俩 程 。 
c. 使 用 线索 树 的 优点 是 什么 ? 
4 46 二 又 查找 树 预先 假设 搜索 是 基于 每 个 记录 只 有 一 个 关键 字 。 设 我 们 想 要 能 够 执行 或 
者 基于 关键 字 Key, 或 者 基于 关键 字 Keyz 的 查找 。 
上， 一 种 方法 旦 建立 两 棵 分 离 的 二 又 树 。 这 需要 多 少 额 外 的 指针 ? 
b. 另 一 种 方法 是 使 用 2-d 树 。2-d 树 类 似 于 二 叉 树 ， 其 不 同 之 处 在 于 , FRE H 
Key, 来 分 叉 ， 而 在 奇数 层 用 Kev xe 47M, Kd 4-64 显示 一 棵 2-d BS, 以 名 (first 
name) AIRE (last name) 作为 美 键 字 对 第 二 次 世界 大 战 后 的 美国 总 统 进行 查找 。 
总 统 的 姓名 是 按照 年 代 顺 序 插 和 人 的 (杜鲁门 ， TARRAK, Sew, Aww, eae 
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AS, 福特 , 卡特 , 里 根 , 布什 , 充 休 顿 }， 编 与 一 个 加 一 樟 2-4 树 进行 插入 的 例 程 。 
ec. 编写 一 个 商 效 的 过 程 PST ED LR Loug si Kev, High, W Low, 
zz Keys High IPIS (8] Br A LLL 
d. 指出 如 何 扩充 2-4 树 以 处 理 和 多 于 两 个 的 搜索 关键 宁 : MSA SHIT i k-d P 


wign Etsenhower * ^ junn Kennedy 


"n -全 -77 ut 00m e f nmn 
H 5, ki ` 
M _--—-- lu ens PL, Ks 
C George Bash Gerald Fard nen Johnson ， Re haid Nixon 
—— é — 一 = 一 = 一 -一 — - 
f 
PA ’ E 
-一 一 ~- D —— f — _ = 一 -= 

“Ril Clinton ~ denny Canes ~ ' Road Reagan ^ 
"m m S E SENE 


图 464+ -fR2-d BH 
25 75 X. RÀ 


美玉 一 又 树 的 更 多 的 信息 ， 特 别 足 树 的 数学 性 质 扣 以 在 Knuth, 23] 积 [24] 的 两 本 书 中 找 全 . 
AILE ICGCARBEE HI LX £r ERE RESCUE Dod RES biased deletion) 算 法 引起 的 平 衡 不 足 问 题 ， 
Hibbard 的 论文 -20] 提 出 原始 删除 算法 并 确 站 了 -次 删除 保持 桂 的 随机 性 .文献 .21] 各 5， 
分 别 对 只 有 三 个 市 点 的 树 和 四 个 节点 的 树 进 行 了 全 面 的 分 林 。Fppitleer A ie 3c 15 TE T AE 
随机 性 的 早期 经 验 性 的 证 据 . 而 Culberson 种 Munro 的 论文 -41 各 1121 则 提供 了 蘑 些 解析 论 
证 { 但 不 是 对 混 茶 揪 人 和 期 除 的 一 般 情形 的 元 党 证 明 ). 

AVL 树 由 Adclson- Velskii 和 Landis; 1 424). AVL MH BATRA RM AVL BE BE 
ALAS UES BTR AR ee 22; Pape. AVL BEAD IBIERTE HE A MÆ FR Bh - 
ft AVL 树 中 平均 搜索 开销 的 分 析 是 不 完 全 的 , (BA. 25 RRR ER 

文献 -31 和 [9] 善 虑 了 类 似 本 书 4.5.1 5258 mg AE 伸展 树 在 [29 qi Td. 

AL cdd op p. JAS OCF ATR VRAT SERE A TREE TE IN BB 15 cx OLBE I i 

在 :树叶 上 ， 我 们 描述 过 的 数据 结构 有 时 叫做 B^ b. OER BRT Tea or re 
8 :报告 了 各 种 方案 的 经 验 性 结果 .23 桂香 了 树 的 分 机 可 以 在 !4 . . L14 EL [33 ] PE I. 
练习 4.14 使 人 误 以 为 很 蕉 。 一 种 解法 可 以 在 16] 中 找到 练习 4.26 取 自 ; 32]. 在 练习 
4.38 PARERI B - 树 的 信息 可 以 在 -13 THAR Bl. 853] 4.42 RR XC 2]. 580] 4.43 EGET] 
2N 6 次 旋转 ,解法 在 |30] 中 给 出 、 练 习 4.45 中 使 用 的 线索 首先 在 [28 中 提出 。 k-d REB 
最 早 提 出 是 在 [7] 中 , ESR EF AE GEHEN, SCAR 8 LTTE T kd 树 以 及 其 他 
_. 些 用 于 多 维 搜索 的 方法 ; 本 书 第 12 章 也 进行 了 简要 的 讨论 。 

另外 一 些 流 行 的 平衡 查找 树 是 红 黑 树 - 19] 利 威权 平衡 树 27]。 在 第 12 mn] 可 以 找到 出 多 

的 平衡 树 方案 , 此 外 进 可 以 在 著作 7171、:26! 以 及 .31| 中 找 氏 ， 
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RIAR 4 Ehe ERR ADT、 它 共 许 对 一 组 元 素 进 行 各 种 操作 ， 本章 讨 论 数 列表 
Chash tabteyATDT， 不 过 它 只 支持 一 又 查找 树 所 允许 的 一 部 分 操作 . 

A PASAT SCHL AS A  Chashing) BOWE 种 用 于 以 常数 平均 时 间 执 行 插入 、 删 除 
利 碍 找 的 技术 . EE. 那些 需要 元 素 问 任何 排序 信和 总 的 操作 将 不 会 得 天 有 效 的 支持 . 因此， 
jfi 4l FindMin, FindMax 以 及 以 线性 时 间 将 排 过 序 的 束 个 表 进 行 打印 的 操作 都 是 向 列 所 不 支 
FFAN., 

本 至 的 中 心 数据 结构 是 散 列 表 , 我 们 将 

* AHULARI RELE nk. 

。 分 析 比 较 这 些 方法 ， 

。 介绍 藤 列 的 多 种 应 几 ， 

。 将 散 列 表 和 一 义 查 找 树 进 行 比 较 。 
5.1 一 般 想 法 

理想 的 藤 列 点 数据 结 梅 上 共 不 过 是 一 个 包 洁 有 关键 字 的 具有 轩 定 大 小 的 数组 。 些 型 情况 
F. 一 个 关键 字 就 是 一 个 带 有 相关 值 { 例 如 工资 信息 } 的 字符 串 . 我 们 把 表 的 天 小 记 作 Tabie- 
Sixze,， 并 将 其 理解 为 散 列 数据 结构 的 一 部 分 而 不 仅仅 是 浮动 于 全 局 的 某 个 变量 , 通常 的 习惯 
M ERM O F) TadleSize -1 变化 ; 稍 后 我 们 就 会 明日 为 什么 此 这 样 。 

^pTOX BEES E RM, O 到 TableSize 一 | 这 个 范围 中 的 茶 0 
个 数 , 并 且 被 放 到 和 运 当 的 单元 中 。 SN a ” |! 
(hash function) ,理想 情况 下 它 应 该 运算 简单 计 且 应 该 保证 任 和 — 7. 07 
两 个 不 同 的 关键 字 映射 到 不 同 的 单元 。 不 过 ,这 和 是 不可 能 的 , 因 0C me 
为 单元 的 数目 是 有 限 的 ， 而 关键 字 实 际 上 是 用 不 完 的 。 内 此 , 我 | 9 ———3À 
们 了 半 找 一 个 散 列 函 数 , 该 渭 数 要 在 单元 之 间 均 匀 地 分 配 关 键 子 ， ， 
图 5-] à 个 典型 的 理想 情况 ,在 这 个 例子 中 , john BYES, 3 
phil 散 列 到 4。、dave RSIR G, mary 散人 列 到 7 8 

DERRY lo] SR A Ae Ra, 9 
HEMRA Ph ESE sS] — (8 8 mE fee RANY (collision) ) 
请 该 做 什么 以 及 如 何 确 定 散 列 表 的 大 小 。 


5.2 BEBE 

如 果 输 入 的 关键 字 是 整数 ， 则 - AR A AIR" Key mod TableSize "lr 
Wb. 除非 Key 磁 巧 具有 某 些 不 理想 的 性 质 , 在 这 种 情况 下 ， BO SRI PE ETT PROS IS 
例如 ， 若 表 的 大 小 是 10 而 关键 字 都 以 0 为 个 位 , 则 此 时 上 述 标准 的 散 列 晃 数 就 是 一 个 不 好 的 
选择 。 此 原因 我 们 将 在 后 面 看 和 到, mic jew Fm HEBEL. 杂 的 办 法 遂 常 是 保证 表 的 大 
小 是 素数 。 当 输入 的 关键 宁 是 随机 整数 时 ， 艇 列 函数 不 仅 算 起 来 简单 而 且 关 键 宁 的 分 配 也 很 


E 
| dave 275] i 
— 一 
| mary 28200 


[ 


Co 


图 51 -CARP E 


[150] 





AV 


I, REF EPA ; 在 这 种 情形 下 , 散 列 函数 需要 仔细 地 选择 ， 
一 种 选择 方法 是 把 字符 混 中 字符 的 ASCH 码 值 加 起 来 。 在 图 5-2 rp, 我们 声明 类 型 
lndex， 它 是 散 列 函数 的 返回 值 类 型 . 网 5-3 实现 该 想法 并 用 典型 的 哉 方式 通过 将 字符 逐个 相 


TE Ap BERS AF 


图 5-2. aS pR ese E] a 8 


Index 
Hash( const char *Key, int TableSize ) 
{ 


unsigned int HashVal = 0; 


while( *Key != "\G' } 
HashVal += *Key++; 


return Hashval % TableSize; 





图 5-3 -个 简单 的 散 列 函数 


图 5.3 中 描述 的 散 列 函数 实现 起 来 简单 而 且 能 够 很 快 地 算出 答案 。 不 过 ,如果 表 很 大 ， 
则 函数 将 下 会 很 好 地 分 部 关键 宁 。 例 如 , 设 TableSize = 10007(10 007 是 素数 ), 并 设 所 有 的 
关键 字 至 多 8 个 字符 长 。 出 于 char 型 量 的 值 最 多 是 127, 因此 散 列 函数 只 能 假设 值 在 0 和 
1016 之 间 , 其 中 1016= 127X8。 显然 这 不 是 一 种 均匀 的 分 配 ， 

吕 一 个 散 列 函数 由 图 5-4 表示 。 这 个 散 列 通 数 假设 Key 至 少 有 两 个 字符 外 加 NULL 结束 
符 . 值 27 表示 英文 字母 表 的 字母 个 数 外 加 一 个 空格 , 而 729 = 27 。 该 函数 只 考查 前 三 个 字 
符 , 但 是 , 很 如 它们 是 随机 的 ,而 表 的 大 小 像 前 面 那样 还 是 10007, 那么 我 们 就 会 得 到 -一 个 合 
理 的 均衡 分 配 。 可 是 不 石 的 是 , 英文 不 是 随机 的 。 虽然 3 个 字符 (忽略 空格 ) 有 26°= 17 576 
种 可 能 的 组 合 , 但 查验 词汇 量 足 够 大 的 联机 词典 却 揭示 ; 3 个 字母 的 不 同 组 侣 数 实 际 只 有 
2 851。 即 使 这 些 组 侣 没有 冲 罕 , 也 不 过 只 有 表 的 28% RAT BONS), 因此, 虽然 很 容易 计 
算 , 但 是 当 散 列表 足够 大 的 时 候 这 个 函数 还 是 不 合 运 的 。 


Index 
| Hash( const char *Key, int TableSize 3 
1 


return ( Key[ 0 ] + 27 * Key[ 1 ] + 729 * Key[ 2 ] ) 
X TableSize; 










疼 5-4 “ 另 一 种 可 能 的 散 列 函数 一 一 个 太 好 


图 5-5 刚 出 了 散 列 函数 的 第 3 种 尝试 。 这 个 散 列 函数 涉及 到 关键 字 中 的 所 有 字符 , TFA 
_ 般 可 以 分 布 得 很 好 ( 它 计算 57 Keyl KeySize — i = 11132’, 并 将 结果 限制 在 运 当 的 
范围 内 )。 程序 根据 Horner 法 则 计算 一个 (32 的 ?多 项 式 函 数 。 例 如 ,计算 h= kit 27k. 十 
2 k4 的 另 一 种 方式 是 异 助 于 公式 A = (Cka) X 27 + ka) X 27 + by 进行 。 Horner 法 则 将 





i Index | 
Hashf const ghar *Key, int TableSize ) 


unsigned int HashVal = D 


fe e while( *Key := 'NQ' 3 
| EFL HashVal — C HashVal «e 5 3 + *Keyeast 
| fu ge return Hashval % TableSize; 


我 们 之 所 以 用 32 代替 27, 是 因为 用 32 MESE AERIS, mede gem). 
为 了 加 还 ,在 程序 第 2 行 的 加 法 可 以 用 按 位 异 或 来 代 答 . 

图 5-5 所 描述 的 散 列 育 数 鳄 表 的 分 布 向 旧 未 必 十 菩 好 的 ,但 是 确实 具有 极其 简单 的 优点 
CRUSE FOU EM. 那么 速度 也 很 快 ). 如 果 关键 字 特 别 长 . FS ZR OR CLE GR ORE S ER 
过 多 的 时 间 ， 不仅 如 此 ,前 面 的 字符 还 会 三 移出 最 终 的 结果 在 这 种 情况 下 , 通常 的 做 法 是 
不 合用 所 有 的 字符 。 此 时 关键 字 的 长 度 和 性 质 将 影响 选择 - 例如 , 关键 字 可 能 类 完整 的 街道 
地 址 ,向 列 员 数 可 以 包括 街道 地 址 的 儿 个 字符 ,也 许 是 城市 和 名 和 旦 政 区 码 的 儿 个 字符 ,有些 
TEH 人员 通过 只 使 用 奇数 位 置 二 的 溯 符 来 实现 他 们 的 散 列 是 数 ,这 里 有 这 人 么 一 层 想 法 : 
用 计算 散记 本 数 节省 下 的 时 间 来 补偿 由 此 产 牛 的 对 列 匀 地 分 布 的 函数 的 轻微 干扰 ， 

剩 下 的 主要 编程 细节 是 解决 冲突 的 消除 问题 . ari RO PTR Ah POL RU 
fr E Cod fü RD, NEAL BEER. 这 个 冲突 需要 消除 。 解 决 这 种 冲 帘 的 方法 有 几 种 ， 
我 们 将 讨论 其 中 最 简单 的 两 种 : 分 离 链接 法 和 开放 定 址 法 - 

5.3 分 离 链 接 法 

解决 冲突 的 第 一 种 方法 通常 叫 敌 分 离 链 接 法 (separate of Jit oT, 
chaining). 其 做 法 足 将 艇 列 色 同一 个 值 的 所 有 元 素 保留 到 -个 I| TIPE 
表 中 .为 方便 起 见 , BURMA BR, AL, 表 的 实现 与 第 3 LOT 
章 中 的 实现 方法 相同 。 如 果 空 间 很 紧 , TE AW ”4 EF 
Gee tok. 本 节 我 们 假设 关键 字 是 前 10 个 完全 平方 数 并 SEO [RR 


iti He 4 PRR LE Hash (X) = X mod 10. RIAD IE XC SL poH segs 


用 在 这 里 是 为 了 简单 ) 图 5-6 做 出 更 清晰 的 解释 : 一 中 
为 执行 Find, 我 们 使 用 散 列 函数 来 确定 完 竟 专 察 哪 个 表 . | ao, 


He FRAT EA BE 89 45 X D CER Led PETERE BY A OUR TE 
Br. ALT Insert, FR CL UI PORE BE PK RR aE 
As ER fici SIEA MA JU, HE A a PIR, PRT 
SEM RTE! 1), d REP TUAE RET CR. Hi a tod aie A BLA RD. 或 者 被 搬入 到 
ASHORE. MARRARA. Maa EEF THE c e TD EI — FR 有 时 新 元 率 插 
ABU AAU Bi E ARAA E, 而 且 还 因为 新 近 插 入 的 元 素 最 有 可 能 最 先 锌 访问。 

完 现 分 离 链接 法 所 需要 的 类 型 声明 在 网 5-7 PRH, 图 中 的 ListNode 结构 与 第 3 章 中 的 


[5-6 ”分离 链接 艇 列表 


[14 


— M — — a 





Be SN BSE 
链表 声明 相同 。 图 中 的 散 列 表 结 构 包 括 --- 个 链表 数组 (以 及 数组 中 的 链表 的 个 数 ), 它们 在 散 
列表 结构 初始 化 时 动态 分 配 空间 。 此 处 的 HashTable 类 型 就 是 指向 该 结构 的 指针 类 击 。 






#ifndef | HashSep..H 
struct ListNade; 
typedef struct ListNode *Position; 


struct HashTh1; 
typedef struct Hashibl *HashTable; 


void DestroyTable( HashTable H }; 

Position Find ETementType Key, HashTable H 3; 

void Insert( Elementlype Key, HashTable H 3; 
ETementType Retrieve( Position P 3; 

/* Routines such as Delete and MakeEmpty are omitted */ 


sendif /* HashSep H */ 


/* Place in the implementation file */ 
struct ListNode 


ÉlementType Element; 
Pasition Next; 


[ 

HashTable InitializeTable( int TableSize j; 
| 

1 

}; 

typedef Position List; 


/* List *TheList will be an array of lists, allocated later * 
/* The lists use headers (for simplicity), */ 
/* though this wastes space */ 
struct HashTbl 

int TableSize;: 

List *Thelists; 
hi 


T — er — 


图 5-7. 分 离 链接 散 列表 的 类 型 声明 


注意 ，TheList 域 实际 上 是 一 个 指向 指向 ListNode 结构 的 指针 的 指针 。 如 果 不 使 用 这 些 
typedef, 那 可 能 会 相当 混乱 。 

图 5.8 列 出 初始 化 函数 , 它 用 到 与 栈 的 数组 实现 中 相同 的 想法 。 第 4 行 到 第 6 行 给 一 个 
散 列 表 结 构 分 配 空 间 。 如 果 空 间 允 许 , 则 机 将 指向 一 个 结构 , 该 结构 包含 一 个 整数 和 指 网 一 
Meet, 第 7 行 设置 表 的 大 小 为 一 素数 , 而 第 8 行 到 第 10 行 则 试图 指定 List 的 一 个 数 
组 ,由 于 List 被 定义 为 一 个 指针 ,因此 结果 为 指针 的 数组 。 

自如 List 的 实现 不 用 表 头 , 那么 我 们 就 可 以 到 此 为 止 了 。 但 是 我 们 使 用 THA, 因此 必 
Abb BABE APRA IEEE Next BE NULL. 这 由 第 11 到 第 15 行 实现 。 当然 , 第 
12 行 到 第 15 行 可 以 用 语句 

H —  TheLists| i ] = MakeEmpty(}; 

(Ree, BARR RAE RABY, 但 是 因为 该 例 中 它 胜 过 使 程序 尽 可 能 日 包含 , 所 以 
它 当然 值 得 考虑 。 我 们 程序 的 - -个 低 效 之 处 在 于 第 12 行 上 的 malloc Hir S H -> Tableise 
次。 这 可 以 通过 在 循环 出 现 之 前 调用 一 次 malloc 操作 


H- > TheLists = malloc {H — > TableSize * sizeof (struct ListNode)); 


| 


， Fia 
| Ar 


O 
| A 
| 


(^ 


| 


a 


ae | 
InttializeTable( int TableSize ) 


] 


l*/ 


2*/ 
i*/ 


anf 
Sn 
6*/ 


af 


ae; 
9*/ 


/*10*/ 


/*11*/ 


sees) 
/*13*/ 
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/*15*/ 


/*16*/ 


HashTable H: 
int 1]; 


iti TableSize < MinTableSize ) 


Error( "Table size too small" 3; 
return NULL; 


} 


H = matloc( sizeof( struct HashTbl ) 2; 
iff H == NULL } 
FatalError( “Out of space!!!" J}; 


H->TableSize = NextPrimac Table5ize }; 


/* Allocate table */ 

/* Allocate array of lists */ 

H-»TheLists = malloc( sizeof( List ) * H->TableSize 3; 

ift H-»Thel ists == NULL } ! 
Fata Error( "Out of space!!!" 5; | 


/* Allocate list headers */ 


Fort $ = 0; i < H-»Tablesize; i++ ) 
1 
H-»Thelists[ i ] = malloc( sizeof( struct ListNode ) 3; 
ft H-»Thelists[ i ) == NULL 2 
FatalError( “Out of space!!!" 9; 
else 
H-»TheLists[ i ]-»Next = NULL; 
} 
| return H; 


图 5-8 ”分 离 链 接 散 剂 表 的 初始 化 例 程 


(RARE 12 行 来 避免 . 第 16 行 返回 H, 

对 Find( Kev， 吾 ) 的 调用 将 返回 一 个 指针 ，| 该 指针 指向 包含 Kev 的 那个 单元 、 KARE 
程序 在 图 59 PIE. 注意 , 第 2 行 到 第 5 行 等 同 于 第 3 章 中 给 出 的 执行 Find 的 程序 。 因 此 ， 
第 3 章 中 表示 ADT 的 实现 方法 可 以 用 到 这 里 。 记 住 ， 如 果 ElementType 是 一 个 字符 串 ， 那么 


比较 种 赋值 必须 相应 地 使 用 stremp 和 strepy 来 进行 。 


| /* at/ 


/* 2"/ 
/* 3*/ 





Position 
Findt ElementType Key, HashTable H j 


i 


Position P; 
List L; 
L = H-»Thetists[ Hash( Key, H->TableStze ) ]; 
F = L->Next; 
while( P l= NULL && P->Elament l= Key à 
/* Probably need strcomp!! */ 


| od 


y* 4*/ P = P--Hext; 
fe ue return P; 
1 


图 5-9 分 离 连 接 散 列表 的 Find HE 
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下 一 个 是 插入 例 程 。 如 果 要 插入 的 项 已 经 存在 , 那么 我 们 就 什么 也 不 做; 否则 我 们 把 它 
放 到 表 的 前 端 ( 见 图 5-10)。? 该 元 素 可 以 放 存 表 的 任何 地 方 ; 此 处 这 样 做 是 最 方便 的 。 注意 ， 
搬入 到 表 的 前 端的 程序 基本 上 等 同 于 第 3 意 中 使 用 链表 实现 Push 的 程序 ， 如 采 第 3 章 中 的 
那些 ADT 都 已 经 仔细 地 实现 了 , BACH aT ANAM. 


void 
Insert ElamentType Key, HashTabie H 2 
{ 


Position Pos, NewCell; 
List L; 


Pos = Find( Key, H 3; 
it Pos == HULL ) /* Key is not found */ 
Newel] = malloc( sizeof( struct ListNode ] 3; 
ift NewleTl == NULL 3 
Fatalérror( "Out of space!!!" 5; 
else 


L = H-»Thelists[ Hasht Key, H-»TableSize ) ]; 
MewCell--Mext = L-»Next; 

MewCell-»Element = Key: /* Probably need strcpy! */ 
L >Next = MewCell; 





图 5.10 分 岛 链 接 散 麟 表 的 Insert FFE 


图 5.10 中 的 搬 人 例 程 写 得 多 少 有 些 不 好 ,因为 它 计 算 了 两 次 散 列 天 数 。 才 余 的 计算 总 是 
不 好 的 , 因此 , 如 果 这 些 散 列 例 程 真 的 梅 成 程序 运行 时 间 的 重要 部 分 ， 那么 这 个 程序 就 应 该 
152) WE, 
156 删除 便 程 是 链表 中 的 期 除 操作 的 直接 实现 , ARTA ee BE. 如 果 在 散 列 的 诸 例 
程 中 椒 包 括 删 除 操作 , 那么 最 好 不 要 使 用 表 头 ， 因为 使 用 表 头 不 仅 不 能 简化 问题 而 且 太 要 浪 
费 大 量 的 空间 。 我 们 也 把 它 作为 一 道 练 避 留 给 读者 。 
除 链表 外 , 任何 的 方案 都 有 可 能 用 来 解决 冲突 现象 ， 一 棵 二 丸 查 找 树 甚至 另外 一 个 散 列 
表 均 可 胜任 , 但 是 我 们 期 望 如 果 表 大 , 同时 散 列 函数 好 , 那么 所 有 的 表 就 应 该 短 ， 这 样 就 不 
至 于 进行 任何 复杂 的 尝试 1 o 
我 们 定义 散 列 表 的 装填 因子 (load factor ) A 为 散 列 表 中 的 元 素 个 数 与 散 列表 大 小 的 比 但 。 
在 上 面 的 例子 中 , A = 1.0。 表 (list) 的 平均 长 度 为 和 。 执行 一 次 查找 所 需要 的 工作 是 计算 散 
列 函 数值 所 需要 的 常数 时 间 加 上 遍历 表 {list) 所 用 的 时 间 ， 在 一 次 不 成 功 的 查找 中 , 通 历 的 链 
接 数 平均 为 4{ 不 包括 最 后 的 NULL 链接 )。 成 功 的 查找 则 需要 遍历 大 约 1 + (A /2) ERR: 
它 保证 必然 会 侦 历 一 个 链接 {因为 查找 是 成 功 的 )， 而 我 们 也 期 望 党 着 一 个 才 (list) 中 途 就 能 
找到 匹配 的 元 素 。 这 就 指出 ， 表 的 大 小 实际 上 并 不 重要 ， 而 装填 因子 才 是 重要 的 。 分 离 连 接 
Evi] 的 一 般 法 则 是 使 得 表 的 大 小 尽量 与 预料 的 元 素 个 数 差 不 多 ( 换 句 话说 ， 让 Ast). 正如 前 
mes, 使 表 的 天 小 是 素数 以 保证 一 个 好 的 分 布 ， 这 也 是 一 个 好 的 息 法 。 


o BUEH 5.6 中 的 表 是 通过 插入 到 表 的 末端 建立 的 , 因此 图 5-10 中 的 程序 特产 生 一 个 将 图 5-6 HB de fi P td EE 
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5.4 开放 定 址 法 


分 离 链 接 散 列 算法 的 缺点 旺 计 要 指针 ,由 于 给 新 单元 分 配 地 址 需 归 时 间 ,， 因 此 这 束 疆 竹 
答 法 的 速度 多 少 有 些 减 民 ， 辣 时 算法 实际 上 还 要求 对 另 PRR AAS COL. 除 使 用 链表 解 
peas}, JTGÁACE ALE P&C Open addressing hashing aSr PFA Ee BR PSR aA TE 
RCE AIRE RSP, Epod... LE ATE PTT. DORNER S B 
单元 为 止 Ah, 单元 hy XO. Ay (XM), A2 0(X), BS, Mami, Hn AX) = 
(Hash X) + Fi) mod TahleSize. H F(0) = 0. BAR P EE TR EAE. 因为 所 有 的 数 
HERE R ABA, SOF EnV IA Ems S ACE EA REA NK AOR, 对 
井 放 定 证 散 列 算 法 来 说 , EPR Fa = 0.5. BARRO BES Pa OR 
Uu nk 
5.4.1 线性 探测 法 

在 线性 探测 法 中 . 函数 上 是 i 的 线性 函数 , BI EEC) = i. 这 相当 于 逐个 探测 每 
个 单元 [必要 时 可 以 绕 辐 ) 风 查找 出 -个 空 单 元 . 图 5-11 显示 使 用 与 前 面相 同 的 夏 询 纯 数 将 
iB EY 189, 18, 49, 58, 69: di A E- T LE rp e EO, E HERBA vp RE flt e 77 1L EE 
Fi) i 





图 511 每 次 插 人 后 使 用 线 此 探测 得 到 的 开放 定 址 散 列 表 


第 -个 证 罕 在 插入 关键 字 49 时 产生 ; ERRA F :个 空间 地址 ， 即 地 址 0 该 地 赴 是 二 
放 的 、 关键 字 SB 依次 和 IS, 89, 49 RAR, 试 选 二 次 之 后 才 找 到 - 个 空 单 元 。 对 的 的 冲 
灾 川 类 似 的 方法 处 理 。 只 归 表 足够 大 ， 总 能 够 找到 一 个 身 由 单元 , 但 是 如 此 化 费 的 时 间 是 相 
“ea. WAHE, ERRE, 这 样 占 据 的 单元 岂 会 开始 形成 一 些 区 块 ， 共 结果 称 为 
— E R primary clustering), Fue, SARK rat (p f 36 B CABG E UK ER oe HE 
mmh, ORIG dne es SU HEUS RD 

ORTEGA LR fox gu B HERE, 但 是 可 以 证 二, 使 Hy p rg i eg po 39] Pat ROT T iE 
入 和 不 成 功 的 查找 来 说 大 约 为 二 (1 + {41 - 4)), Mid FL RAEI AEH 1 14 
qol 相 美的 一 此 计算 多 少 有 些 复杂 .从 程序 中 容易 看 出 ， 社 人 和 不 成 功 青 找 需 要 相同 


_18 WV 


CRAY. EARED, AR BEER EAN ae ARE ILE TR BEAD B) E81 [8] o 

如 果 聚 集 不 算是 问题 , 那么 对 应 的 公式 就 不 难得 到 . 我 们 假设 有 一 个 很 大 的 表 , 并 设 每 
次 探测 都 与 前 面 的 探测 无 关 。 对 于 随机 症 帘 解 洪 方法 而 言 , 这 些 假 设 是 成 立 的 , 并 且 当 不 
是 非常 接近 于 1 时 也 是 合理 的 。 首先 , 我 们 导出 在 一 次 不 成 功 咨 找 中 探测 的 期 望 次 数 ， 而 这 
正 是 直到 我 们 找到 一 个 空 单元 的 探测 的 期 望 次 数 。 由 于 空 单 元 所 占 的 份额 为 1 - A, AER 
们 预计 要 探测 的 单元 数 是 1/0 一 A), 一 次 成 功 查 找 的 探测 次 数 等 于 该 特定 元 素 插入 时 所 需 
要 的 探测 次 数 。 当 一 个 元 素 被 播 人 时， 可 以 看 成 是 一 次 不 成 功 查 找 的 结果 - 因此 ,我们 可 以 
使 用 一 次 不 成 功 查 找 的 开销 来 计算 一 次 成 功 查找 的 平均 开销 。 

需要 指出 , 4 在 0 到 当前 值 之 间 变 化 ,因此 早期 的 揪 入 操作 开销 较 少 ,从 而 降低 平均 开 
销 。 例如 , 在 上 面 的 琢 中 , A = 0.5, 访问 18 的 开销 是 在 18 被 插 人 时 确定 的 , 此 时 4 = 0.2. 
由 于 tS 是 植 入 到 一 个 相对 空 的 表 中 ， 因 下 对 它 的 访问 应 该 比 新 近 插 入 的 元 素 ( 比 如 69) 的 访 
问 更 容易 , 我 们 可 以 通过 使 用 积分 计算 插入 时 间 平 均值 的 方法 来 估计 平均 值 ， 如 此 得 到 

1G)7 E]. Hori 

这 些 公式 显然 优 于 线性 探测 那些 相应 的 公式 。 聚 集 不 仅 是 理论 上 的 问题 ,而且 实际 上 也 发 生 
在 具体 的 实现 中 。 图 5-12 把 线性 探测 的 性 能 ( 虚 曲 线 ) 与 对 更 随机 冲 罕 解决 方法 中 期 望 的 性 
能 作 了 比较 。 成功 的 查找 用 S$ 标示 , 不 成 功 查 找 和 插入 分别 用 U 和 1 标记 。 


Ul 





15.0 
12.0 
9.0 
6.0 
30 ; 
A0 .18 .20 25 .30 35 .40 45 50 55.60 65 70 .75 .80 .85 .90 95 


Bl512 ”对 线性 探测 (虚线 ) 和 随机 方法 的 装填 因子 画 出 的 探测 次 数 
(S 为 成 功 查找 ; U 为 不 成 功 查找 ; M Lodi A) 


HIER A = 0.75, 那么 上 面 的 公式 指出 在 线性 探测 中 一 次 插入 预计 探测 8.5 UC, MI A= 
0.9, 则 预计 探测 50 次 , 这 是 不 合理 的 。 假如 聚集 不 是 问题 , 那么 这 可 与 相应 装填 因子 的 4 次 
和 10 次 探测 相 纪 。 从 这 些 公 式 看 到 , 如 果 表 可 以 有 多 于 一 半 被 十 满 的 舌 ， 那么 线性 探测 就 个 
是 个 好 办 法 。 然 而 , 如 果 = 0.9, 那么 播 入 操作 平均 只 需要 探测 2.3 次 , 并 且 对 于 成 功 的 查 
找平 均 只 需要 探测 1.5 次 。 

5.4.2 平方 探测 法 

平方 探测 是 消除 线性 探测 中 一 次 素 集 问题 的 冲突 解决 方法 。 平方 探测 就 是 冲突 消 数 为 一 
次 通 数 的 探测 方法 。 流 行 的 选择 是 FG) = 2, 图 5-13 显示 了 使 用 该 钟 突 函数 所 得 到 的 刁 前 
而 线性 探测 例子 相同 的 开放 定 址 散 列表 

当 49 与 89 冲突 时 ,其 下 一 个 位 置 为 下 一 个 单元 , 该 单元 是 空 的 , 因此 49 就 被 放 在 屠 








HE. 此后， 58 在 位 置 8 奸 产 生 溃 突 , 其 后 机 分 的 单元 经 探测 得 知 发 生 了 男 外 的 溃 突 ,下 一 个 
探测 的 单元 在 距 位 置 8 为 2 一 4 下 处 , 这 个 单元 是 个 空 单元 , RE, KEF 58 就 放 在 单元 2 
处 对 于 美 键 宁 69， 处 理 的 过 程 世 一 样 ; 
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图 5.13. 在 每 次 插入 后 , HAEA ERA JT RC E EL ze 


对 十 线性 探测 ,让 元 标 几 乎 填 满 散 列 表 并 不 是 个 好 主意 ,内 为 此 时 表 的 性 能 会 降低 。 对 
于 平方 探 浏 情况 甚至 更 精 : 一 号 表 被 填 满 起 过 -- 半 ， 当 表 的 大 小 不 是 素数 时 其 至 在 表 被 填 渍 
-opzi 就 不 能 保 让 一 次 和 到 一 个 空 单元 了 。 这 是 因为 最 和 多 有 表 的 一 六 可 以 用 作 解 决 冲 突 
iE Sata 

RIEPEN, WERA- AESA, HLTA ERM, 那么 我 们 保证 总 能 够 
插入 -个 新 的 元 素 


定理 5.1 

如 果 使 用 平方 探测 ， 且 表 的 大 小 是 素数 , 孝 么 当 表 至 少 有 一 半 是 空 的 时 外 ,总 能 够 十 入 
xu ps. 

证 明 : 


分 表 的 大 小 TableSize 是 一 个 大 丁 3 i 4) RR. RINEN, 前 L TableSizeA2J 个 备 选 位 
RARI AIX) + Ümod TableSize )JFüACX) + j (mod TubleSize Mut a PAY 
^. 其 由 0 < i, je TableSise/ 21. NIE TI. 假 没 这 项 个 位 置 相同 , (iy, P 

ACM) = f= AX) + y) (mod TableSize ) 


i= gt (mod TableSize ) 
i-g-10 (mod TableSize ) 
(2 — gp) fi ty) 70 (mod TableSize ) 


由 于 TableSize Méx, 因此 , BAG - 门 等 于 0(mod TableSize), BAU + J) T N mod 
TableSize ). BEER i HI) RH SEI, 那么 第 一 个 选择 是 不 可 能 的 BO < i. p< _Tabledize / 
2 因此 第 二 个 选择 也 是 不 可 能 的 。 从 而 ,前 .TableSize/ 2 PAARE CRM, TR 
情人 的 元 灶 { 若 无 任何 冲突 发 牛 ) 也 可 以 放 公 经 散 列 得 到 的 单 志 ,因此 任何 元 素 部 有 
Tapfesize /21 个 可 能 被 放 到 的 位 置 .如 果 最 多 有 :TabieSize /24 个 位 时 可 以 使 用 , BEA EE 
元 总 能 够 找到 。 
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| Ko* 
哪 伯 表 有 比 一 半 多 一 个 的 位 置 被 填 满 ,那么 插入 都 有 可 能 失败 (虽然 这 是 非常 难以 见 到 


的 )。 把 它 记 住 很 重要 。 另 外 , RAD ARR AER RE. 如果 表 的 大 小 不 是 素数 ,， 则 备 
选单 元 的 个 数 可 能 会 锐 减 。 例 如 , 奋 表 的 大 小 是 16, RABBIT RAE RIE 1, 4 或 9 


距离 处 。 


在 开放 定 址 散 列 表 中 , 标准 的 删除 操作 不 能 施行 ,因为 相应 的 单元 可 能 已 经 引起 过 冲 
A, 元 素 绕 过 它 存在 了 别处 . 例如 ， 如 果 我 们 删除 S9, 那么 实际 上 所 有 其 他 的 Find 例 程 都 将 
不 能 正确 运行 。 因 此 , 开放 定 址 散 列 表 需 要 懒惰 删除 , 虽然 在 这 种 情况 下 并 不 存在 天 还 意义 


Ea RAR 


实现 开放 定 址 散 列 方法 所 需要 的 类 型 声明 在 图 5-14 中 表示 。 这 里 , 我 们 不 用 链 肯 数组 ， 
而 是 使 用 获 列 表 项 单元 的 数组 ,与 在 分 离 链 接 散 列 中 一 样 , 这 些 单元 也 是 动态 分 配 地 址 的 : 
该 表 的 初始 化 (图 5-15) 由 分 配 空间 (第 1 行 到 第 10 行 ) 及 其 后 的 将 每 个 单元 的 Info 域 设置 为 


Empty 组 成 。 


Q RURSUM 48+ 3 的 素数 ， 且 使 用 的 平方 冲突 解决 方法 为 POS ti, 那么 整个 表 均 避 被 探测 到 . 












xifndef _HashQuad_H 





typedef unsigned int Index; 
typedef Index Position; 


























struct Hashib!, 
typedef struct HashTb] *HashTable; 


Hashtable InitializeTable( int TableSize ); 

void DestroyTable( HashTable H ); 

Position Find( ElementType Key, HashTabla H J; 

void Insert ElementType Key, HashTable H J; 
ElementType Retrieve( Position P, HashTable H 3; 
HashTable Rehash( HashTable H 2; 

/* Routines such as Delete and MakeEmpty are omitted */ 


#andif  /* .HashQuad H */ 


/* Place in the implementation file */ 
enum KindOfEntry { Legitimate, Empty, Deleted }; 


struct HashEntry 

{ 
ElementType Element; 
enum KindOfEntry Info; 

h 


typedef struct HashEntry Celi; 


/* Cell *TheCells will be an array of */ 
/* HashEntry celts, allocated later * 
struct HashTb] 
{ 

int Tablesize; 

Cell *TheCet is; 
E 


图 5.14 ”开放 定 址 散 列 表 的 类 型 声明 
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其 代 


Hashtable 
Initial'izeTable( int TableSize ) 
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Hash'ab!e H; 


| 
| int 3: 
| A [tee ifi TableSize < MinTableSize } 
{ 
/* 2 / Error "Table size too small" 3; | 
/* 3 return NULL; 
| i 
/* Allocate table */ 
| fm gry H = malloc’ sizeof struct HashTbi j 3; 
/* 5*/ ifi H == NULL b 
/* Ber Fatal£rrar( "Out of space!!!" 3; 
A Phy H-»TabieSize = NextPrime( TableSiza ); | 
/* Altocate array uf Cells */ 
A Bry H-»TheCells = malloc( sizeof( Call ) * H-»TahleSize 3; 
fe ge iff H-»TheCells == NULL ) 
/*l0*y/ FatalError( "Out of space!!!" j; d 
A forf 3 = 0; i « H-»TableSize; i++ 3 | 
J*i2*/ H-»TheCellsE i ].l1nfo = Empty; | 
| Fl return H; 
— ] 


图 5-15 4036 ETE COE a PRI 


如 同 分 离 链接 散 列 法 - - 样 ， Find Key, 万 ) 将 返回 Key 在 散 列表 中 的 位 置 。 如 果 Key 不 
HW 那么 Find 将 返回 最 后 的 单元 。 该 单元 就 是 当 需 要 时 ，Key 将 被 插入 的 地 方 。 此 外 , E 
为 被 标记 了 Empty, 所 以 表达 Find 失败 很 容易 ; 为 了 方便 起 见 , 我 们 假设 散 列 表 的 大 小 至 少 
为 发 中 雹 素 个 数 的 二 倍 ,， 因 此 平方 探测 方法 总 能 够 实现 。 否 则 , 我 们 就 要 在 第 4 行 前 测试 ; 





ye ity 
fe 2j 
/* 34/ 


f» aey 
f^ Se 
/* 6 


fe aes 


Position 
Find( ElementType Key, HashTable H 3 
1 


Position CurrentPos; 
int CollisianNum; 


CollisionNum = 0; 
CurrentPos = Hash( Key, H-»TableSize 3; 
while€ H-»TheCells[ CurrentPos ].Info !- Empty && 
H-»TheCelis— CurrentPos J.Element != Key 2 
;* Probably need strcamp!! */ 
| 
CurraentPos + 2 * «CollisionNum - 1; 
ifC CurrentPos >= H->TableSize ) 
CurrentPos -= H-»TableSize; 
} 


return CurrentPos; 





图 5-46 ”使 用 平 太 探测 散 列 法 的 Find GEE 


第 4 行 到 第 6 行为 进行 平方 探测 的 快速 方法 。 由 平方 解决 函数 的 定义 可 若 , FO) = 
FG - 1) + 2i 1, 因此 ,下 一 个 要 探测 的 单 虑 可 以 用 乘 以 2 实际 上 就 是 进行 一 位 二 进 
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制 移 位 } 并 减 1 来 确定 。 如 果 新 的 定位 越过 数组 , 那么 可 以 通过 减 去 TableSize 把 它 拉 回 到 数 
组 范围 内 。 这 上 比 通常 的 方法 要 快 , 因为 它 避 免 了 看 似 需 要 的 乘法 和 除法 。 注意 一 条 重要 的 警 
告 ; 第 三 行 的 测试 顺序 很 重要 ， 切 细 改 变 它 ! 

REPARERA 正如 分 离 链 接 散 列 方法 那样 , A Key 已 经 存在 ， 则 我 们 就 什么 也 不 
RW. 其 他 工作 只 是 简单 的 修改 。 耕 则 , 我 们 就 把 要 插入 的 元 素 放 在 Find 例 得 指出 的 地 方 。 程 
序 在 图 5-17 中 显示 。 


void 
Inserti Elementlype Key, HashTable H 3 
{ 


Position Pos; 


Pos = Find( Key, H ); 
ifC H->TheCells[ Pos ].Info != Legitimate ) 


{ 

/* OK to insert here */ 
H->TheCellsf Pos ].Info = Legitimate; 
H->TheCells[ Pos ].ETement = Key; 

/* Probably need strcpy! */ 





图 5-17 AY RRR RANE 


虽然 平方 探测 排除 了 一 次 聚集 , 但 是 散 列 到 同一 位 置 上 的 那些 元 素 将 探测 相同 的 备 选 单 
Fe, XX MUA E A (secondary clustering)。 二 次 聚集 是 理论 上 的 一 个 小 缺憾 。 模拟 结果 指出 ， 
对 每 次 查找 , 它 一 般 要 引起 另外 的 少 于 一 半 的 探测 ,下面 的 技术 将 会 排除 这 个 缺憾 , 不 过 这 
雪花 费 另 外 的 一 些 乘 法 和 除法 。 
5.4.3 WHF 

我 们 将 和 本 考察 的 最 后 一 个 冲 讼 解决 方法 是 双 散 列 (double hashing)。 对 于 双 散 列 , — fbit 
行 的 选择 是 F(i) = ie pewmha(X)。 这 个 公式 是 说 , 我 们 将 第 二 个 散 列 函 数 应 用 到 X 并 在 距 
Bj hasho(X), 2hah2( 关 ) 等 处 探测 。hash( 关 ) 选 择 得 不 好 将 会 是 灾难 性 的 。 BIR, SHE 99 fü 


入 到 前 面 例 子 中 的 输入 中 去 , 则 通常 的 选择 hash (X) = X mod 9 将 不 起 作用 。 因 此, 0833 
一 定 不 要 算得 0 (A. 另外 , 保证 所 有 的 单元 都 能 被 探测 到 (在 下 面 的 例子 中 这 是 不 可 能 的 因 


为 表 的 大 小 不 是 素数 ) 也 是 很 重要 的 。 诸如 Aasha X) = R ~ CX mod R) 这 样 的 函数 将 起 到 
良好 的 作用 ,其 中 R 为 小 于 “abteSize 的 素数 。 如 果 我 们 选择 尺 = 7, 图 5-18 加 显示 插入 与 


前 面相 同 的 关键 字 的 结果 。 


第 一 个 冲突 发 生 在 49 被 插 人 的 时 蛋 。hash2(49) = 7 - 0 = 7, B49 被 插入 到 位 置 6。 
hash4(58) = 7 - 2 = 5, 于 是 58 被 插入 到 位 置 3。 最 后 ,69 FER, 从 而 被 插入 到 距离 


为 hash2(69) = 7 - 6 = 1 的 地 方 。 如 果 我 们 试图 将 60 插入 到 位 置 0 处 ， 那么 就 会 产生 一 个 


冲突 。 由 于 hash(60) = 7 — 4 = 3, 因 此 我 们 尝试 位 置 3, 6, 9, 然后 是 2， 直到 找 出 一 个 室 
的 单元 。 一般 是 有 可 能 发 现 某 个 坏 情 形 的 ， 不 过 这 里 没有 太 狗 这样 的 情形 。 
前 面 已 经 提 到 ,上面 的 散 列 表 实 例 的 大 小 不 是 素数 。 我 们 这 么 伍 是 为 了 计算 散 列 函数 时 


方便 , 但 是 ， 有 必要 了 解 在 使 用 双 散 列 时 为 什么 保证 表 的 大 小 为 素数 是 重要 的 。 如 果 想 要 把 
23 插 人 到 表 中 , 那么 它 就 会 与 59 发 生 冲 突 。 由 于 hash2a(23) = 7 一 2=5， 下 该 表 大 小 是 


10, 因此 我 们 只 有 一 个 备 选 位 置 , 而 这 个 位 置 已 经 使 用 了 。 因 此 ， 如 果 表 的 大 小 不 是 素数 , A 
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么 备 选单 元 就 有 可 能 提前 用 完 。 然 而, 如 及 双 散 列 正确 实现 , MEUR. WOU OM UCRR 
儿科 和 随机 冲突 解决 方法 的 情形 相同 。 这 使 得 权 散 列 理论 上 很 有 哎 引 力 . 不 过 , 平方 探测 不 
需要 使 用 第 一 个 散 列 丽 数 ， 从 而 在 实践 中 叮 能 不 简单 并 且 更 快 ， 


一 一 一 -， == 


EAG | 


| s | 








5.5 再 散 列 


对 于 使 用 平方 探测 的 开放 定 址 散 询 法 ， 如果 表 的 元 素 填 得 太 满 ,那么 操作 的 运行 时 间 将 
开始 消耗 过 长 , H Insee 操作 可 能 失败 这 可 能 发 生 在 有 太 多 的 移动 和 插 人 混合 的 场合 . 此 
(b. —Rbdg ie Bib mM TA Kg ds Cn HE T ARSXEEU ARCU eR, HR 
SARE, HABEN CS ER S) C SIEG CH (ELO TRE HC ACE nn 

例如 , 设 将 元 素 13. 15, 24 和 6 搬 人 到 大 小 为 了 的 开放 定 十 艇 列表 中 : APRA CX) 
= X mod 7. 设 使 用 线性 探测 方法 解决 冲突 问题 . 插入 结果 得 到 的 散 列 表 肯 示 在 图 5-19 
中 

旭 果 将 23 插 人 表 中 , 那么 图 5-20 中 插入 后 的 表 将 有 超过 70% 的 单元 是 满 的 。 SL GR 
得 过 满 , 所 以 我 们 建立 一 个 新 的 表 : 该 表 大 小 之 所 以 为 17, 是 因为 17 EER RAAF I BRE 
PES. READE BON ACX) = X mod 17。 扫描 原 米 的 表 , HÉJA 6, 15, 23, 2414 
及 13 揪 人 到 新 表 中 。 最 后 得 审 的 表 见 网 5-21, 











of 6 oi 6 | 
| n p _ 
1 15 ' 15 
2 | NN 23 
3 4 TN 4 
mttu 一 ”一 一 一 
4 | | 4 一 EE | | 
5 g | 5 = 
6! 13 E eoo E i 
fo os ooo 
图 519 使 用 线性 探测 揪 人 13. 15, 图 s-20 ER PER A 
6, 24 Waal eb e 23 MAA CREE REOR 
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S SPE PERE ER (rehashing), 显然 这 是 一 种 非常 昂贵 
BERE. 其 运行 时 间 为 O(N), 因为 有 N 个 元 素 要 再 散 列 而 表 的 
大 小 约 为 2N, 不 过 , 由 于 不 是 经 第 发 生 , 因此 实际 效果 根本 没有 
这 么 差 。 特 别 是 ,在 最 后 的 再 散 列 之 前 必然 已 经 存在 NA2 次 
Insert， 当 然 添加 到 每 个 插入 上 的 花费 基本 上 是 一 个 常数 开销 。 ~ 
如 果 这 种 数据 结构 是 程序 的 一 部 分 , 那么 其 效果 是 不 显著 的 ; 田 
一 方面 ， 如 果 再 散 列 作为 交互 系统 的 一 部 分 运行 , 那么 其 搬入 引 
起 再 散 列 的 不 幸 的 用 户 将 会 感到 速度 减 慢 。 

再 散 列 可 以 用 平方 探测 以 多 种 方法 实现 。 一 种 做 法 是 只 要 表 满 
到 一 半 就 再 散 列 。 另 一 种 极端 的 方法 是 只 有 当 揪 人 失败 时 才 再 散 OT! 
5$). 第 二 种 方法 即 途中 (middleof the road) RM: 当 表 到 达 某 一 个 装 
填 因 子 时 进行 再 散 列 。 由 于 随 着 装填 因子 的 增加 表 的 性 能 的 确 有 下 
UE, 因此 , 以 好 的 截止 手段 实现 的 第 三 种 策略 , 可 能 是 最 好 的 策略 。 |， 

再 散 列 把 程序 员 从 表 太 小 的 担心 中 解放 出 来 , 这 一 点 很 重 15 
E 因为 在 复杂 的 程序 中 散 列 表 不 能 够 做 得 任意 她 大。 后 面 的 练 1 
习 让 你 考查 再 散 列 与 懒惰 删除 联合 使 用 的 情况 。 再 散 列 还 可 以 用 
在 其 他 的 数据 结构 中 。 例如 ,如果 第 3 章 队 列 数据 结构 变 满 时 ， ”图 521 在 再 散 列 之 后 
孝 么 我 们 可 以 声明 一 个 双 倍 大 小 的 数组 ,并 将 每 一 个 成 员 找 贝 过 的 开放 定 址 散 列 表 
来 , 同时 释放 原来 的 队列 。 

图 5-22 FEAR, FRAT AY SE BR fa] R. 
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HashTable 
Rehash( HashTable H 3 
i 

int i, OldSize; 
fell] *Oldcelis: 


f* l*/ OldCells = H-»TheCells; 
f* 2*6 OldSize = H-»TableSize; 


/* Get a new, empty table */ 
f* a*/ H = InitializeTable( 2 * OldSize J); 


/* Scan through old table, reinserting into new */ 


fr 4"j for( i = 0; i < OldSize; i++ ) 
f* 5*7 iff OldCells[ i J.Info == Legitimate } 
f/* G Insert( OldCeils[ i l.Element, H 3}; 


i Fes freet OldCelts }; 
F &8*/ return H; 
} 


5-22 ”对 开放 定 址 散 列 表 的 再 散 列 


5.6 可 扩散 列 
本 音 最 后 的 论题 处 理 数据 量 太 大 以 至 于 装 不 进 主 存 的 情况 。 正 如 我 们 在 第 4 章 看 到 的 ， 


Oo 这 就 是 为 什么 新 表 要 做 成 老 才 岗 倍 大 的 原 关 。 
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HEITER EEE EN R SR UII Sa CC - 
与 前 面 : E, 我们 假设 在 任 一 时 肇 都 有 N TG (AA N BUTE Gr EIC IT. 
最 多 可 把 M 个 记录 放 入 - MEEKER ATE M = 4. 
AT SC AW RAE IEA UIA ox ot EE UTA, 邢 么 主要 的 问题 芷 于 、 在 一 次 Find HEE 
i]. 溃 党 可 能 引起 多 个 区 块 被 考察 ， 茂 至 寻 于 埋 想 分 布 的 藤 到 表 岂 在 所 难免 DLE. CH 
表 杰 得 过 满 的 时 候 ， 必 须 执行 代价 启 大 的 任 散 列 这 一 步 ， 它 需要 OCNOUIX E S A. 
-AHER E) e FE OY ie AP aK, extendible hashing). E feiTH)I IK EEA ALIA T R 
Find, Ja ABE fE tm BRE 9 ERREUR HI. 
回忆 第 4 3€, B- 树 具有 深度 O(logua NO. BMA M E, B-REIBIZRIE DER Hie ES 
们 可 以 选择 M 如 此 的 大 , BERE BARREA 1. 此 时 , 在 第 一 次 以 后 的 任何 Find 部 将 花费 一 [167 
gk BEDS], 因为 据 推 测 根 节点 可 能 存在 主 存 中 . 这 种 方法 的 问题 在 于 分 文系 数 (branching os! 
factor) kA, META TENOREA RI EEIT REPARE TTE. Sa fri — Lier) | 
时 间 可 以 减 缩 , 那么 我 们 就 将 有 - :个 实际 的 方案 : 这 正 基 可 扩散 列 司 用 的 要略 . 
现在 让 我 们 假设 , 我 们 的 数据 由 儿 个 5b 比特 整数 引 成 ， 图 5-23 显 术 这 些 数据 的 可 扩散 列 
iat. 树 ” 的 根 含有 4 个 指针 ,它们 由 这 些 数据 的 前 两 个 比特 确定 每 片 树 时 有 百 到 AT = 
ATH 碰巧 这 里 每 片 树叶 中 数据 的 前 两 个 比特 都 是 相同 的 ; 这 由 图 括号 内 的 数 指 出 :为 
fs. FD 代表 根 所 使 用 的 比特 数 , 有 时 称 其 为 目录 (direetery)- 于 是 ,目录 中 的 项 北 
3; 22. q, 为 树叶 工 所 有 元 素 共 有 的 最 高 位 的 倍数。d FRE FERAN, BE dim D. 
ares ASE 100100. tc UE ARS aT, 但 是 第 一片 树叶 已经 满 了 ， IE as [RETE 
fice, RERE gm AERUE E HUE, ET RS a eG BOREAS 


增加 到 3 ”这些 变化 通过 图 5-24 反映 出 来 。 
[pw pr 
\ Z 


SEEN E 
| | ` t 
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111000 


inl 





& 523 可 扩散 并 : 原始 数据 E 524 al pees, fr 00100 dA RA RA AIG 


注意 , HD ARR SE ORT LTE TE cH SS H se ARTE, FA. BOR PORES. 
43 E Ho ftp up Be A m TAH. 

AD BE ERE ACHE F 000000. 362,28 - HE REDESUE BUT RE. 生成 4, = 3 RORIUTRITE 由 
PD = 3. 故 在 目录 中 所 做 的 性 一 变化 是 000 和 001 指针 的 更 新 - 外 图 5-25, 

这 个 目 常 简单 的 方法 提供 了 对 大 型 数据 库 Insert 操作 和 Bind 操作 的 快速 在 到 时 间 , 这 
H, GRIT HT TF ARIE 

首先 , AMS HB MCR TD + ^- Bj 5j c FH d HES ELE ARS T 
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ii, SER rae, D = 2, WRA 111010, 111011, 并 在 最 后 搬入 111100, 那么 月 录 
大 小 必须 增加 到 4 以 区 分 五 个 关键 字 ,。 这 是 一 个 容易 考虑 到 的 细节 , 但 是 千 万 不 要 忘记 它 。 
其 次 , 存在 重复 关键 字 (duplicare key) MOREE AES FE M 个 重复 关键 字 , 则 该 算法 根本 
无 歼 。 此 时 ,需要 做 出 某 些 其 他 的 安排 。 


pa Pe [oe [on [ow Por Poe Tony 
(2) 
111000 


(3 






(3) } C2} (3) 
(00000 | 1001000 | [010100 | | 100000 [ [101000 
OOOO) iG01010 | 4011006 1 | TOO TOO | 1 1OT EGO | [111001 


001011 


图 5-25 可 扩散 列 : 在 000000 插 人 及 树叶 分 裂 后 


这 些 可 能 性 指出 ， 这些 比特 完全 随机 是 相当 重要 的 , 这 可 以 通过 把 这 些 关键 字 散 列 到 合 
理 长 的 整数 (因而 是 名字) 来 完成 。 

BIS, 我 们 介绍 可 扩散 列 的 某 些 性 能 , 这 些 性 能 是 经 过 非常 困难 的 分 析 后 得 到 的 。 这 些 
结果 基于 合理 的 假设 : EX bir pattem) Z&15 5] 2r TE B] 

树叶 的 期 望 个 数 为 (N/M)logze。 因 此, 平均 树叶 满 的 程度 为 2 = 0.69, 这 和 BA TE: 
RE. 其 实 这 完全 不 奇怪 ,因为 对 十 两 种 数据 结构 , 当 第 (AM + 1) 项 被 添加 时 , 一些 新 的 
节点 就 建立 起 来 。 

更 惊 瑚 的 结果 是 ,日 录 的 期 望 大 小 ( 换 句 话说 即 272g OXON! MM). WR M 很 小 ， 
那么 月 录 可 能 过 和 分 地 大。 在 这 种 情况 下 , 我 们 可 以 让 树叶 包含 指向 记录 的 指针 而 不 是 实际 的 
记录 , 这样 可 以 增加 M 的 值 。 为 了 维持 更 小 的 日 录 , 可 以 把 第 二 个 磁盘 访问 座 加 到 每 个 Find 
操作 中 去 。 如 果 目 录 太 大 装 不 进 主 存 , 那么 第 二 个 磁盘 访问 怎么 说 也 还 是 需要 的 。 


Bs ot 


ID ZE 


sci ei] BL FASE DL ROR DS EE] SIC. Insert 和 Find 操作 。 当 使 用 散 列 表 时 , 注意 诸如 装 
HATRA TERHES, 否则 时 间 界 将 不 再 有 兹 。 当 关 键 字 不 是 短 串 或 整数 时 , F 
组 选择 散 列 函数 也 是 很 重要 的 。 

对 于 分 离 连接 散 列 法 ,虽然 装填 因子 不 很 大 时 性 能 并 不 明显 降低 ， 但 装填 因子 还 是 应 该 
接近 于 1。 对 于 开放 定 此 散 列 算法 , 除非 完全 不 可 避 仇 ， 否则 装填 因子 木 应 该 超过 0.5。 WHR 
使用 线性 探测 ,那么 性 能 随 着 装填 因子 接近 于 1 将 急速 下 降 。 再 散 列 运算 可 以 通过 使 表 增 长 
(或 收缩 ) 来 实现 ,这样 将 会 保持 合理 的 装填 内 子 . 对 王 空间 紧缺 并 BLS T REE RE ARIK 
的 情况 ,这 是 很 重要 的 。 

一 叉 查 找 树 也 可 以 用 来 实现 Insert 和 Find 和 运算。 虽然 平均 时 间 界 泥 O(log ND. 但 是 二 
及 查找 树 也 支持 那些 需要 序 的 例 程 从 而 时 强大 。 使 用 散 列表 不 可 能 找 出 最 小 元 束 。 除非 准确 
若 道 一 个 字符 串 ， 和 否则 散 列表 也 不 可 能 有 效 地 查找 它 。 二 及 查找 树 可 以 迅速 找到 在 一 定 范 围 


这 特别 是 因为 合用 上告 找 树 不 需要 滋 法 和 除法 : 

男 一 方面 . BO aa ROK A OSE BR a m4 LA A RETE SO ie ty 
MBA. Fy ATR RSE TR IE. TRUE. |RSS SEA E A L RTEA iE PF T 
有 怀疑 , IB BRA TEE Cd 1k PR HE SES 

HOS SE PA. SES AR RS PAT BR ey a PR t n ds 
TE3 (symbol tabie]， 散 列表 是 这 种 问题 的 理想 应 用 , 因为 只 有 Insert 和 Find Wair. PRIH 
ff - 般 都 不 长 , BEHE RR EE a HI. 

ew Zech PIECE A Bg. (EFIE. Td 83 bs Hm n xt 
"Fo XB, 当 输 入 被 读 进 的 时 候 , 顶点 则 按照 它们 出 现 的 顺 抒 从 eee A EE. BR 
AL, 输入 很 可 能 有 一 组 -一 组 依 字 母 央 闻 排 麟 的 项 . 例 好 , 顶 避 可 以 是 计算 机 - 此 时 ， 如 来 “个 
特定 的 计算 中 心 措 它 的 计算 机 列表 成 为 bml. ibm2. ibm3. 等 等 , OBA, Erf Ré dE IE TE 
效率 方面 可 能 会 有 戏剧 性 的 效 乐 - 

虞 列表 的 第 三 种 常见 的 用 途 尽 在 为 游戏 编制 的 程序 中 ， 当 恕 序 搜索 游戏 的 不 同 的 行 IH， 
HREGBSBIEDRECTdu Bene ij m. UUEDdREUfE SDPRHRAHER. RU EDS 
iilfep HIREGHadriAcpsRé S vg de HOA 游戏 程序 的 这 种 JA E nu fr HE d E (rraneposi 
tion table). 

敬 列 的 另 . -个 用 途 是 在 线 拼写 检验 程序 如果 错 拼 检测 ( 与 正确 性 相 比 ) 更 市 要 ， BAS 
个 时 妥 可 以 被 再 散 列 , 单词 则 可 以 在 常数 时 问 内 被 检测 CPU etae Cr DE, PL 
母 顺序 排列 单词 并 不 重 上 要 ; TET TE SAE HCBU ons CRB ER PEAT 

我 们 通过 返回 到 第 LESE gE[a BOE SE x-- du. Bn aifh HS 1 Ps T 
法 ,并 日 假 设 最 大 单词 的 太 小 是 菜 个 小 常数 ,那么 读 入 包含 W TR BIO E A EER AH 
wile ait fal A OCW). XP LAB AT BE RA O iR did Ee Ln ie ACE. HS 
(HAR HE - puso, FU, Tru. 字符 数 ) 测 试 - PR, 由 十 每 次 有 
海 时 间 为 OC, 而 只 存在 常数 个 方向 (8) 和 每 个 单词 的 学 符 . 内 此 这 一 阶段 的 运行 时 间 为 
ORC). 总 的 运行 时 间 是 ORC + WO. 它 是 对 原始 OCR CW ETAT SL A BE 我 们 
还 可 以 做 进一步 的 优化 , 它 能 够 降低 实际 的 运行 时 间 。 这 些 将 在 练习 中 挡 述 : 


练习 
5.1 给 定 和 输入 ,4371. 1323, 6173, 4199, 4344, 9679. 1089) ALAC eka ACN = 
X (mod 10), AHER: 
a. 分 离 链 接 艇 列表 。 
b. 使 用 线性 探测 的 开放 定 持 散 列 表 . 
c, 使 用 平方 探测 的 开放 定 进 破 列表 
d. 第 二 前列 隐 数 为 hy 入 ) = 7 (Xmod DÉIF GE HEAL PY - 
5.2 指出 将 练习 5.1 PATRAS LRU mE 
5.3 编写 一 个 程序 , HEBCRE FA PEREQN  GEIPRU D Be ABO HAW BR PLE UBI 32 
的 冲突 次 数 。 | | 
5.4 (A BS REAR TUBS GEE ACER BER TEERAA IR TH) 在 这 种 情况 
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F., 我 们 可 以 再 散 列 一 个 表 , 大 小 为 原 表 的 一 半 , 设 当 存在 相当 于 表 的 天 小 的 二 倍 
BASH AHR. 我 们 再 散 列 到 一 个 更 大 的 表 。 企 再 散 州 到 一 个 更 小 的 表 之 
HI, BRIM KA AR? 
另 一 种 冲突 解决 策略 是 定义 AEI] FG) = n. HP ros OA ri ra, eee FN 
是 前 N 个 整数 的 随机 排列 {每 个 站 数 怡 好 出 现 一 次 )。 
. 证 明 , 在 这 种 策略 下 ,如果 表 不 满 , 那么 冲突 总 能 够 被 解决 ， 
,能够 期 望 这 种 策略 会 消除 聚集 码 ? 
， 如 果 表 的 装填 内 子 是 A, 执行 一 次 插入 的 期 望 时 间 是 凶 少 ? 
.如 果 表 的 装填 因子 是 4, 执行 一 次 成 功 查 找 的 期 望 时 间 是 多 少 ? 
一 个 有 效 算法 {理论 上 以 及 实际 上 ) 生 成 随机 序列 。 SERES fI ASTE PP 的 那 
些 法 则 是 重要 的 ? 
各 种 冲 罕 解决 方法 的 优点 和 缺点 是 什么 ? 
编写 一 个 程序 , 实现 下 面 的 方案 , 将 大 小 分 别 为 MAN WAA E T sparse 
polynomial) P, 和 P; HR. 每 个 多 项 式 代 表 一 个 链表 , BHM SM HARM. HU 
及 Next 指针 组 成 (练习 3.7)。 RIE P; 的 项 乘 以 P, 的 每 一 项 ， 总 的 运算 次数 为 
MN. 一 种 方法 是 将 这 些 项 排序 并 合并 同类 项 , 但 是 . 这 需要 排序 MN 个 记录 , 代 
(aT REAR ES. 特别 是 在 小 内 存 环境 下 , 另 -- 种 方案 , 我 们 可 在 多 项 式 的 项 进行 计算 
时 将 它们 合并 ,然后 将 结 采 排序 。 
a. 编写 一 个 程序 实现 第 二 种 方案 。 
b， 如 果 输 出 多 项 式 大 约 有 OCM + NPR, BERI SR TI BL Er e op? 
-个 拼写 检查 程序 读 进 一 个 输入 文件 并 显示 出 所 有 在 某 个 在 线 词 典 土 坦 不 出 的 单 
词 . 设 该 词典 含有 30 000 单词 ,而 文件 很 大， 以 至 于 算法 只 能 对 该 输 和 人 文件 进行 一 
未 检查 。 一 种 简单 的 方案 是 将 该 词典 读 入 一 个 散 列表 , 随 着 单词 的 被 读 进 而 查找 每 
一 个 单词 设 一 个 平均 单词 有 -七 个 字符 并 且 能 够 将 长 度 为 上 的 单词 大 入 L + 1 个 
字 节 中 (因此 空间 的 浪费 不 像 考 虑 的 那么 多 ), 假设 有 一 个 开放 定 址 表 , XE IP 
空间 ? 
如 果 内 丰 有 限 并 且 整 个 目录 不 能 装 进 一 个 散 列 表 中 , 那么 我 们 仍然 能 够 得 到 一 个 有 
效 的 算法 , 该 算法 几乎 总 能 正常 工作 ， 我 们 声明 一 个 位 Lbit) 数 组 Table (CR 
化 均 为 0) ,数组 大 小 从 (和 到 TubleSize - 1。 当 读 进 一 个 单词 时 , RIE Table 
[ Hash( Word) ij — 1。 下 列 鱼 论 哪 个 止 确 ? 
4. 如 果 一 个 单词 散 列 到 -个 其 值 为 0 的 位 置 , 那么 该 单词 不 在 词典 中 ， 
b， 如 果 - 一 个 单词 淫 列 到 一 个 其 值 为 1 的 位 置 , 那么 该 单词 在 词典 由。 
假设 我 们 选择 TableSize = 300 007. 
c. Ein BETTE? 
d. TEC E PH BE Tr RERO EE EP 
e. HSC MT 500 个 单词 , 可 能 每 页 有 3 个 实际 拼写 错误 ; 该 算法 是 宕 可 有 岂 ? 
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» 5.10 Hob SRS TRE EC Rt O TARAR). 


5.11 


设 欲 找 出 在 长 输入 串 4 A>... Ax PR P P Pi 的 第 一 次 出 现 。 fij PI EU GERE 


PEE HB (pattern. string) 得 到 一 个 散 列 值 H, 并 通过 将 该 值 与 从 ALAz... Ag 





AAA AsAg.. Agia, SAR AY. pe Ay poo. AV ERRENA 
Hog AGAR. RRR TTS PB. SAR DEM 一 个 字 科 
He Op HE Ay CR Re PPL A BOR RSC BS SOCAL. AS ZR CE A 中 的) 
(UBL, TEPC CA Xk BH AS ACU] RET EUG PARE ETT 

sa. 让 明 如 果 AA. )...4,., {AOE LA, ABA A, A, 2... ALL RR a A 

M 常数 时 间 算 出 

b. 证 明和 运行 时 间 为 Ofek + NO) LEES ROL ACA BE ERST Ta] 

«c. UEPB RVE REUS B3 ERE AS ERE 

d. fah- -个 程序 实现 该 算法 。 

eec 描述 一 个 算法 . 其 总 坏 情形 的 运行 时 间 为 Ok + N) 

~ +f. 描述 -个 算法 ,其 平均 运行 时 间 为 OCN) 

5.12 个 BASIC 程序 由 一 系列 按 递 增 蛋 序 编 号 的 语句 组 成 殿 币 是 通过 使 用 goto 或 
gosub 后 如 - :个 语句 序号 实现 的 - 编 寺 一 个 程序 让 进 合 法 的 BASIC Pep TSR ali JE 
新 编 贞 ,使得 第 -名 在 序号 下 外 开始， AEE- -个 语句 的 序号 比 前 Ale D- IR 
可 以 假设 N 条 语句 的 一 个 上 限 , 但 是 在 输入 中 ,语句 序号 可 以 大 到 32 ERR I) E 
Xx. 你 的 程 译 必须 以 线性 时 间 运 行 : 

5.13 a. 利用 本 章 示 尾 描述 的 算法 实现 字谜 程序 、 

b. 通过 存储 每 一 个 单词 WR w 的 所 有 前 绷 , 我 们 可 以 大 大 加 快运 行 速 度 .如 
ow 的 :个 前 级 刚好 是 词典 中 的 - :个 单 闻 , RARE PE Sd OK BÉ 
(i, ) BSR BOR BIR AHS IT RON RRA, 但 实际 上 并 不 是 ,因为 许多 单 
词 有 相间 的 前 绕 、 当 以 某 个 特定 的 方向 执行 -次 扫描 的 上 时候 ,如果 被 查找 的 早 词 
作为 前 织 不 在 散 列表 中 , MAEA AALA AA RE. ATR 
diy C rp BUY ORE EC Y REDRO [8 2R 

c. 如 果 我 们 愿意 御 牧 散 列 表 ADT 的 严肃 性 . MARITE) BB RE PR E - 
例如 ， 如 果 我 们 刚刚 计算 出 ”excel” 的 散 到 函数 , 那么 我 们 就 不 必 青 从 头 开始 计 
fk" excel” SER PI pa ET. y s gcn vs v SERE ALT SP 

d. 看 第 2 eet (CE DURS Rb p fede. 把 使 用 前 组 的 想法 结合 到 你 的 对 分 查找 和 工法 
牛 。 修 改 工 作 应 该 很 简单 .哪个 算法 更 快 ” 

s 14 指出 将 关键 字 10111101, 00000010. 10011041, 10111110, OI TITI2I, 0i9010001、 
10010110. 00001011, 11001111. 10011110, 11011011, 00101011. 01100001, 
11110000. 01101111 插入 到 一 个 空 的 初始 为 可 扩散 到 数据 结构 中 的 结果 , 其 中 M 一 4. 

s 15 编写 一 个 程序 实现 可 扩散 列 。 WE ENA ET EAA, 那么 它 的 性 能 与 分 离 链 托 
和 开放 定 址 散 烈 相 比 如 何 ? 
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所 然 发 送 到 打印 机 的 作业 一 股 被 放 到 队列 中 , 但 这 未 餐 只 是 最 好 的 人 慑 法 - 例如. 可 能 有 
一 项 作业 特别 重要 ,因此 希望 上 只 鉴 打 鲁 机 一 有 空 闪 就 米 处 理 这 项 作业 eho, AEST EEL 
在 宝 时 正好 月 客 个 单 页 的 作业 及 一 更 100 页 的 作业 等 竺 打印, 则 更 合理 的 做 法 也 评 是 莽 乒 处 
AIME, 尽 符 它 不 是 最 后 提交 上 来 的 【不 理 的 是 ,大 多 数 系 统 并 木 这 么 做 ,有 时 可 能 特 
A> A titty.) 

JEM HE, EX ALP EET. BPR AS ie TEA PA ese HR. 一 
般 - -个 进程 只 能 被 允 评 运行 一 个 固定 的 时 间 片 : — PPE EEA PA, Fee Eh Re 
$i] BA VIR. 调度 程序 将 芭 复 提取 队列 中 的 第 一 个 作业 并 运行 它 , 下 到 运行 完毕 或 者 该 作 
业 的 时 间 片 用 完 ， 并 在 作 烛 未 被 运行 完毕 时 把 它 亦 刘 队列 的 末尾 : PR 一 般 开 不 太 侣 

, IN — EE TRE ERI ES REESE RES T ERKAT JIXRESS MERK, 短 的 作 
nemen nA. ik OARE 2, Ae ege TT PEDE P ore PE or EGRE DC 
HA eb. CHEF EXE mo g^ MB IE ER ER, tu RAT LSE C. 

jx Rupee RS wr ROUGE SE SE— 2S PEPPER EA PE. 我 们 称 之 为 优先 队列 (priority queue). 特别 
m. 我 们 将 讨论 

。 和 优先 队列 ADT 的 有 效 实现 。 

© 优先 队列 的 使 用 . 

。 优先 队 俐 的 高级 实现 . 
瑚 们 将 春天 的 这 类 数据 结构 属于 计算 机 村 党 中 最 讲究 物 一 客 . 


6.1 模型 


优先 队列 是 允许 至 少 下 列 了 丙种 捞 作 的 数据 结构 : Inscrr 插 入 ), "EB T TEE E rf s ILAS. 

IJ A DeleteMin 删除 最 小 者 }, 759 LE Red 1B, ER PRODR ER DEA 91] dd 9 2023 o Insert 

操作 等 价 于 Enqueue ATA), iff DeleteMin 则 是 队列 中 DequeueC 出 队 ) 在 优先 队列 [中 的 等 价 操 
ee 丽 数 也 变更 它 的 和 输入- 软件 工程 界 当 蕴 的 想法 认为 这 不 再 是 一 个 好 的 思 串 .不 [177] 

上 历史 的 原 内 我们 将 继续 使 用 这 个 丽 数 ; 许多 得 序 设计 员 期 望 DelereMin 以 这 种 方式 


还 十 


tla] 大 多 数 数据 站 构 那 样 . 有 时 可 能 要 添加 : "ue RE. 但 这 些 添 加 的 操作 属于 扩展 的 操 
A. 而 本 属于 图 6-1 所 描述 的 某 木 模型 


—— 
| 
| 
us Insert H ; 
_ DeleredMind i | nonis Queue H A ———— 





— — 
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外 部 排序 的 - FERRE Cgreedy algerithm) 的 实现 方面 优先 队列 也 很 重要 ,该 算法 通过 反复 
求 出 最 小 元 来 进行 计算 ; 在 第 9 章 和 第 10 章 我 们 将 看 到 一 些 特殊 的 例子 。 本 章 将 介绍 优先 队 
列 在 离散 事件 模拟 中 的 一 个 应 用 . 


6.2 一 些 简 单 的 实现 


有 几 种 明显 的 方法 实现 优先 队列 。 我 们 可 以 使 用 一 个 简单 链表 在 表 头 以 O(1) 执 行 插入 
操作 , 并 遍历 该 链表 雇 删除 最 小 元 , 这 又 需要 DUON) 时 间 。 另 一 种 方法 是 , 始终 让 表 保 持 排 
序 状态 ; 这 使 得 插入 代价 商品 (OCN)}) 而 DeleteMin 花费 低廉 (DO(1)). 基于 DeleteMin RIE 
作 次 数 从 不 多 于 删除 操作 次 数 的 事实 ,因此 前 者 荡 怕 是 更 好 的 起 法 。 

青 一 种 实现 优先 队列 的 方法 是 使 用 二 叉 查 找 树 , 它 对 这 两 种 操作 的 平均 和 运行 时 间 部 起 
O(log N)。 尽 管 搬 人 是 随机 的 ， 而 删除 则 不 是 , 但 这 个 结论 还 是 成 立 的 。 记 住 我 们 删除 的 改 
一 元 素 是 最 小 元 。 反复 除去 诺 子 树 中 的 节点 似乎 损害 树 的 平衡 , PHOT. 然而 , A 
子 树 是 随机 的 。 在 最 坏 的 情形 , 妈 DeleteMin 将 左 子 树 删 空 的 情形 下 , 右 子 树 拥有 的 元 素 最 多 
也 就 是 它 应 具有 的 两 售 。 这 只 是 在 其 期 望 的 深度 上 加 了 一 个 小 常数 , 注意 , 通过 使 用 平衡 树 ， 
可 以 把 界 变 成 最 坏 情形 的 界 , 这 将 防 正 出 现 坏 的 插 人 序列 。 

使 用 查找 树 可 能 有 些 过 分 , 因为 它 支持 许 许 多 多 并 不 需要 的 操作 。 我 们 将 要 使 用 的 基本 
的 数据 结构 不 需要 指针 , 它 以 最 坏 情形 时 间 O(log N) 支 持 上 述 两 种 操作 。 揪 人 实际 上 将 花 
费 常数 平均 时 间 , 蔗 无 删除 干扰 ， 该 结构 的 实现 将 以 线性 时 间 建 立 一 个 具有 N 项 的 优先 队 
列 。 然后 , 我们 将 讨论 如 何 实现 优先 队列 以 支持 在 葡 的 合并 。 这 个 附加 的 操作 似乎 有 些 复 杂 ， 
它 显然 需要 使 用 指针 。 


6.3 ZN 


REEE Fd x k TEHA E (binary heap), 它 的 使 用 对 于 优先 队列 的 实现 是 如 
此 的 普遍 ， 以 至 于 当 堆 (heap) 这 个 词 不 加 修饰 地 使 用 时 一 般 都 是 指 该 数据 结构 的 这 种 实现 ， 
在 本 小 节 , 我 们 把 二 允 堆 只 叫做 堆 。 同 二 叉 查 找 树 一 样 , 堆 也 有 两 个 性 质 , 即 结构 性 和 堆 序 
VE, 正如 AVL 树 一 样 , 对 堆 的 一 次 操作 可 能 破坏 这 芮 个 性 质 中 的 一 个 , 因此 , 堆 的 操作 必须 
要 到 堆 的 所 有 性 质 都 被 满足 时 才能 终于 , 事实 上 这 并 不 难 做 到 。 

6.3.1 结构 性 质 

玲 是 一 棵 被 完全 填 满 的 二 叉 树 ， 有 可 能 的 例外 是 在 底层 , ES E 的 元 素 从 去 到 右 盾 人 。 
这 样 的 树 称 为 完全 二 灵 树 (complere binary tree}. 图 6-2 出 示 了 这 样 一 个 例子 。 

容易 证 明 , -HAA h 的 完全 二 义 树 
有 2* 到 24+  - 1 个 节点 。 这 意味 着 , 完全 
一 玉树 的 高 是 L log NI BREE 
Otlog N). 

一 项 重要 的 观察 发 现 , AAS xX 
树 很 有 规律 , 所 以 它 可 以 用 一 个 数组 表示 
而 不 需要 指针 。 图 6-3 中 的 数组 对 应 图 6-2 
中 的 堆 。 

对 于 数组 中 任 一 位 置 i 上 的 元 素 , 其 图 6.2 -ZACISK 
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左 儿 子 在 位 置 2; E, 右 儿子 在 左 儿子 后 的 单元 (2i + DP. 它 的 父亲 则 在 位 置 | i72 E E 
此 、 不 仅 指针 这 里 不 需要 ,而 晶 遍 万 该 枝 所 需要 的 操作 也 极 简单 ,在 大 部 分 计算 机 上 运行 很 
可 能 非常 快 - 这 种 实现 方法 的 惟一 问题 在 于 ,最 大 的 堆 大 小 需要 事先 合计 , 伺 对 于 典型 的 情 
况 这 并 不 成 问题 ,在 图 6-3 中 ， 玲 的 大 小 界限 是 13 TER. 该 数组 有 一 个 位 置 0; 后 而 将 详 
MEUR 











i 
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Ait, — SRE PEE TR — PRE CARR BEDE ZL). 一 个 代表 最 大 值 的 整数 
以 及 当 前 的 叭 大 小 组 成 。 图 6-4 显示 一 个 典型 的 优先 队列 声明 , 注意 与 图 3-47 中 栈 声明 的 相 
似 作 图 6-4a 创建 一 个 空 堆 ., 第 11 行将 在 后 惫 解释 。 


zifndef _BinHeap_H 
struct Heap5truct: 
typedef struct HeapStruct *PriarityQueve 


PriorityQueue Initialize( int MaxElements j; 

void Destroy( PriorityQueue H 5; 

void MakeEmpty( PrinrityQueue H }; 

void Insert( ElementType X, PriorityQueue H ); 
| ElementType DeleteMir( PriorityQueue H 5; 





ElementType FindMing PriorityQueue H 5; 
| inr IsEmpty( PriorityQueue H 5; 
int IsFullt PriorityQueue H 3}: 


| #endif 


Pr Place in implementation file */ 
struct HeapStruct 
1 

int Capacity} 

int Size; 

Elementtype *&lements; 


| 


图 4 优先 队列 的 声明 


术 音 我 们 将 始终 把 玲 画 成 树 , 这 意味 着 ,只 体 的 实现 将 使 用 简单 的 数组 。 
6.3.2 EFE 

Ati PR ae Host HUGE Pk ERE Cheap order) 性 .由 于 我 们 想 要 快速 地 找 出 最 小 元 , 因此 
妃 小 下 应 该 在 根 上 如果 我 们 考虑 任意 子 树 也 应 该 是 一 个 堆 , 那么 任意 节点 就 应 该 小 于 它 的 
Hit 

REDER, RATES ER W- PEN, ATA PER COR 
键 池 小 于 (或 等 于 )X PARE 根 季 点 除外 ( 它 没 有 父亲 ): ^ (EB 6-5 中 左边 的 树 是 

p 关键 字 是 整数 ， 





» Edu, ER TRI EL PRSHE— T Umax HE ERI TE RE d EH PEDRO A URL E I A FA. te AGB 
BT DL HE RA coe bow, fase PERO ERE - 
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然 它们 可 能 任意 复杂 。 


PriarityQueue 
Initialize( int MaxElements 3 


PriorityQueue H; 


ift MaxElements < MinPQSize 3 
Error( "Priority queue size +5 too small" 3; 


H = malloct sizeof struct HeapStruct 3 3; 
A if€ H == NULL 3 
/* FatalError( "Out of space!!!" 3; 


/~ Allocate the array plus one extra for sentinel */ 
A B*/ H->Elements = malloc( C MaxElements + 1) 
* sizeof( ElementType 5 ); 
fe 7*7 if( H-»Elements == NULL } 
/* 8*/ FatalErrorí "Out of space!!!" 5; 


A ge} H->Capacity = MaxElements; 


/*lü0*/ H->5Size = Ü; 
/*11*/ H-»Elements( 0 ] = MinData; 


/812*/ return H: 





图 6-5 MSCS AA AWE) 


179 
M 根据 堆 序 性 质 ， 最 小 元 总 可 以 在 根 处 找到 。 内 此 , 我 们 以 常数 时 间 完 成 附加 运算 


FindMin» 
6.3.3 基本 的 堆 操 作 

Jt Mte LIES ESR, 执行 这 两 种 所 要 求 的 操作 都 是 容易 的 ,只 需要 始终 你 千 
堆 序 性 质 。 
Insert (4A ) 7 l 

为 将 一 个 元 素 X 插入 到 堆 中 , 我 们 在 下 一 个 空 痕 位 置 创 建 一 个 空 六 ， 25 MN HENS A ESE 
全 树 。 如果 又 可 以 放 在 该 空 穴 中 而 并 不 令 坏 堆 的 序 ， 那么 插入 完成 。 BO, 我 们 把 室 灾 的 父 
节点 上 的 元 束 移 人 该 空 六 中 , 这 样 ， AH RE REA LT, BSBA SX BER 
RAST wb. 图 6-6 表示 , AHA 14, Ei HERES F— TY A PEK 由 
于 将 14 插入 空 穴 破坏 了 堆 序 性 质 , 因此 将 31 移入 该 空 闪 ,在 图 6-7 中 继续 这 种 策略 ,直到 城 
HEA 14 的 正确 位 置 。 

P UB UP ILE (porcolate up); Bsc EE Pe EC i 正确 的 位 置 。 使 用 

图 6-8 所 示 的 代码 很 容易 实现 插入 。 
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图 66 尝试 插入 14: 创建 CEN, BATA DH 
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/* H-»-Element[ @ ] is a sentinel */ 


void 
Insert ElementType X, PriorityQugue H j 
{ 


iff IsFull( H } 3 
{ 
Error( "Priority queue is full" 3; 


return; 


I 


for( 1 = 4+H->size; H->klemantsi 1 Z 2 ] > Xi E f= 2) 
H->Elements{ i ] = H->Elements[ i / 2 ]; 
| H->Elements{ 1 ] = X; 
= 


PL 6-8. 搬入 到 :一个 二 义 堪 的 过 程 


其 实 我 们 本 可 以 使 用 Insert 例 程 通过 反复 实施 交换 操作 直至 建立 正确 的 序 来 实现 上 涨 过 
程 , 可 是 一 次 交换 需 旧 3 条 赋值 语句 。 如 果 一 个 元 素 上 滤 Iz. 那么 由 于 交换 而 实施 的 赋值 
的 次 数 就 达到 34 ,而 我 们 这 里 的 方法 却 只 用 d + 【次 赋值 。 

i| RS A UMA. 那么 它 将 一 直 被 推 向 顶端 : 这 样 在 某 一 时 刻 ,; 将 是 1， 
我 们 就 需要 邻 程序 跳出 while 循环 。 当 然 我 们 可 以 用 明确 的 测试 做 到 这 一 点 , 个 过 ， $1 I2 AY 
的 是 抒 一 个 很 小 的 值 放 到 位 置 0 处 以 使 while 循环 得 以 终止 。 ix fe NT GET) 
HE HERE: 我 们 称 之 为 标记 (sentincl}。 这 种 想法 类 似 十 链表 中 头 节 点 的 使 用 。 通过 添加 
— 07 (27.4 (dummy piece of information), FR pate T PE AB BUR a, 从 面市 
省 了 一 些 时 间 ， 

刘 果 谷 插 人 的 元 素 是 新 的 最 小 元 从 而 -- 直 上 滤 到 恨 付 ， HA XX RP dE ALIE RE, eS A 
Dtieg ND. 平均 看 来 , MRSS IEEE SS. 业已 证 明 , DU CHR ACE E 9E 2.607 次 比 


1nt 1; | 
l 


Bi, EE Insert 将 元 素平 均 上 移 1.607 层 。 
DeleteMin( 删除 最 小 元 ) 

DeleteMin 以 潜伏 于 播 人 的 方式 处 理 。 找 出 最 小 元 是 容易 的 ; AEM AR RE. D 
除 一 个 最 小 元 时 , 在 报 季 点 处 产生 了 一 个 空 穴 。 由 于 现在 堆 少 了 一 个 元 素 , 因此 堆 中 最 后 一 : 
个 元 素 X PRB HRB PH. 如 果 X 可 以 被 放 到 空 穴 中 , 那么 DeletcMin 完成 。 不 
过 这 一 般 不 太 可 能 ,， 因 此 我 们 将 空 穴 的 两 个 此 子 中 较 小 者 移 人 空 从 ,这样 束 把 空 从 回 下 推 了 
一 层 。 重复 该 步骤 直到 X 可 以 被 放 人 空 守 中。 因此 , 我 们 的 和 作法 是 将 X EAGER RE 
含 最 小 儿子 的 一 条 路 径 上 的 一 个 正确 的 位 置 。 

在 图 6-9 中 左边 的 图 显示 DeleteMin 之 前 的 堆 。 删除 13 后 , 我 们 必须 要 赴 确 地 将 31 放 到 
Ht, 3. 不 能 放 在 室 灾 中 ,因为 这 将 破坏 堆 序 性 质 。 TE, 我 们 把 较 小 的 儿子 14 BAN, 
同时 空 穴 下滑 一 层 ( 见 图 6-10)。 重复 该 过 程 , 把 19 LAC, 在 更 下 一 层 上 建立 一 个 新 的 宰 
WX. 然后 , 再 把 26 BASK, 在 底层 又 建立 一 个 新 的 空 穴 。 最 后 , 我 们 得 以 将 31 置 入 空 闪 中 
(图 6-11)。 这 种 -MARRA F i (percolate down). 在 其 实现 例 程 中 我 们 使 用 类 似 于 在 
Insert 例 程 中 用 过 的 技巧 来 避免 进行 交换 操作 - 
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图 6-0 fp AA ah eer SAC 


rex O (pdt 
e e n dd. 


6-10 TE DelereMin PAE TERA 


@ yo 
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图 6-11 在 DeleieMin 中 的 最 后 两 步 


TE IE PA FY (AB ) {39 
REISER Pes ie AEM GR SHE HEAR POLE WATE, Ee EE a Pp i B 
FH “个 儿子 的 情况 - Ei ARR AB APL. AR R9 — T- BR AU S 
it. 在 图 6-12 措 述 的 程序 中 , 我 们 已 在 第 8 行进 行 了 这 种 测试 - PR eb eR UE 
始终 保证 你 的 算法 把 每 一 个 节点 都 看 成 有 两 个 儿子 ”为 了 实施 这 种 解法 。 当 堆 的 大 小 为 偶数 
HH 于 ,在 每 个 下 小 开始 时 , 可 将 其 值 太 于 直 中 任何 元 素 的 标记 放 到 堆 的 终端 后 而 的 位 置 |。 你 
Ds EE TRB PAL CAI BIA P. mE a ER E A Sy, 虽然 这 不 再 需 
要 测试 行 儿 子 的 存在 性 , (HERR Es EU DC RT SES IZ. 因为 对 每 ~- a EP EB 


-个 标记 。 
ElementType 
DeleteMin( PriorityQueue H ) 
1 


Int i, Child: | 
FlementType MinElement, LastElement: 


f" 1*7 if IsEmpty( HY 3 
| { 
fe anf Error( "Priority queue is empty" j; ! 
A 3 return H-»EfTements[ O J; 
fe 4ef MinElement = H->Elements[ 1 ]; 
fv 5*7 LastETement = H--Flements[ H->Size-- ]; 
/* orf for( i= 1; i * 2 e= H-»5ize; i - Child ) 
i 
/* Find smaller child */ 
f* Fe Child = i * 2; 
/" B*/ ifi Child != H:»Size && H-»-Elements[ Child + i ] 
/* orf < H->Elements[ Child ? ) 
/*10*/ Chi dde; 
/* Pareolate one leve] */ 
/*ll*/ ift LastE lement > H-»Elements[ Child ] 2 
i H->Elements[ 1 | = H--Elementst Child |; 
else 


f*13*/ break ; 
1 


1 1 
/*l4*/ H-»Elements[ i ] = LastElement; 
return MinkErement; 
/*155/ MinET 
i 


FA 6-12 TE SHEP EAT DelereMin B PAR 


这 种 算法 的 最 坏 情 形 运行 时 间 为 O(log NO. 平均 而 言 , PACERS ICH LY Foe By 
堆 的 底层 ( 它 所 来 自 的 那 层 ),， 内 此 平均 运行 时 间 为 O Cog N). 
63.4 其 他 的 扒 操作 

注意 ,虽然 求 最 小 值 操作 可 以 在 常数 时 间 完 成 , 但 是 , POR ep CI RR BE Be 
小 信 堆 frmmninyhean) 在 求 最 大 元 方面 却 无 任何 帮助 . 事实 上 ， -个 堆 所 编 油 的 关于 邦 的 信息 很 
少 , 因此 , 若 不 对 整个 推进 行 线性 搜索 ， 是 没有 办 法 提出 任何 特定 的 关键 学 的 为 品 明 这 - 
ji. HER 6-13 所 示 的 天 型 堆 结构 (具体 元 素 没有 标 出 ), FRB. OP RA OR A 
道 的 惟一 信息 是 : 该 元 素 在 树叶 上 但是, 半数 的 元 素 位 于 树叶 上 ,因此 该 信息 是 没什么 用 
的 “由 上 这 个 原因 ,如 时 重要 的 是 要 知道 元 素 都 在 什么 地 方 , 那么 除 堆 之 外 , o PLUS 
如 散 列 表 等 某 些 其 他 的 数据 结构 。( 回忆 : 该 模型 并 不 允许 查看 座 内 并 

如 果 我 们 假设 通过 某 种 其 他 方法 得 知 每 -个 元 素 的 位 置 , 那么 有 几 种 其 他 的 操作 的 开销 
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将 变 小 。 下 述 三 种 这 样 的 操作 均 以 对 数 最 坏 情形 时 间 运 行 。 
DecreaseKey( 降低 关键 字 的 值 ) 

DecreaseKey( P, A, 万 ) 操 作 降 低 在 位 置 PP 处 的 关键 字 的 值 , 降 值 的 幅度 为 正 的 量 4。 由 
于 这 可 能 破坏 堆 的 序 , 因此 必须 通过 .上 泪 对 堆 进行 调整 。 该 操作 对 系统 管理 程序 是 有 用 的 : 
系统 管理 程序 能 够 使 它们 的 程序 以 最 高 的 优先 级 来 运行 。 





图 6-13 一 - 棵 巨大 的 完全 二 丸 树 


| InereaseKey( 增 加 关键 字 的 值 ) 


IncreaseKey( P, A, 五 ) 操 作 增 加 在 位 置 P 处 的 关键 字 的 值 ， 增值 的 幅度 为 正 的 量 A。 这 
可 以 用 下 滤 来 完成 。 许多 调度 程序 自动 地 降低 正在 过 多 地 消耗 CPU 时 间 的 进程 的 优先 级 。 
Delete( 删除 ) 

Delete( P, H) PEER HOE 已 上 的 交点 。 这 通过 首先 执行 DecreaseKey CP, 90, 
H), 然后 再 执行 DeleteMin( 卢 ) 来 完成 。 当 一 个 进程 被 用 户 中 下 (而 不 是 正常 终止) 时 ,， 它 必 
须 从 优先 队列 中 除去 - 

BuildHeap( 14 EHE) 

BuildHeap( H)3&43E N 个 关键 字 作 为 输入 并 把 它们 放 人 空 堆 中 。 显 然 ， 这 可 以 使 用 N 
个 相继 的 Insert( 播 入 ) 操 作 来 完成 。 由 于 每 个 Insert 将 花费 OQ(1) 平 均 时 间 以 及 O(log NOIRS 
县 坏 情形 时 间 , 因此 该 算法 的 总 的 运行 时 间 则 是 O{ N) 平 均 时 间 而 不 是 OCUN log N) 最 坏 情 
形 时 间 。 由 于 这 是 一 种 特殊 的 指令 , 没有 其他 操作 干扰 ， 而 且 我 们 已 经 知道 该 指令 能 够 以 线 
性 平均 时 间 实 施 , 因此 , 期 望 能 够 保证 线性 时 间 界 的 考虑 是 合乎 情理 的 。 

_ 般 的 算法 是 将 N 个 关键 字 以 任意 顺序 放 人 树 中 ,保持 结构 特性 。 此 时 ， 如 采 
percolateDown (7 AXA A i Pit, 那么 执行 图 6-14 中 的 该 算法 创建 一 棵 具有 堆 序 的 树 (heap- 


ordered tree) « 
for(i -N/2; i » 0; i-- ) 
FercolateDown( i 3; 









图 6-14 BuildHeap A918] BS 


图 6-15 中 的 第 一 棵 树 是 无 序 树 。 从 图 6-15 到 图 6-18 中 其 余 七 烛 树 表示 出 七 次 Percelate- 
Down 中 每 一 个 的 执行 结果 。 每 条 虚线 对 应 两 次 比较 ; 一 次 是 找 出 较 小 的 儿子 节点 , 另 一 个 十 


RAK (HE) 


将 较 小 的 儿 了 与 该 节点 比较 , 注意 , 在 整个 算法 中 只 有 10 ZR HEEXCDT RELIER TE TES LE 条 一 


TERES, 对 应 20 YX HEFE 
RAA 
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图 6-15 Ac. 初始 堆 ; A: PercolateDown(7 Y Ig 
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图 616 在 : XE PercolateDown( 6) ZL I ; 47: 在 Perolatel owns) 之 后 
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图 6-18 Ac: TE PercolateDownt( 2) 之 后 ; 41: f£. PercolateDown(1) 之 后 


3 r3 BuildHeap 的 运行 时 间 的 界 , 我 们 必须 确定 虚线 的 条 数 的 界 . 这 可 以 通过 计算 上 维 中 
所 有 节点 的 高 度 的 和 来 得 人 到, 它 尾 虚线 的 最 大 条 数 . MERMER RHE: BALA OCN). 
定理 6.1 

d 9b-l1 5 1 Pa AMA AY Be X Wf Cperfeet binary tree) 的 节点 的 E BE OS aA 


951. |] — {b rk 1). |187] 
证 明 : 188° 


as eat, wot pa kee Leg i PA BE 一 | 上 的 2 个 节点 ,高 度 h - 2 工 的 2 T 
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节点 以 及 一 般 地 在 高 度 一 i ER 个 节点 组 成 。 则 所 有 节点 的 高 麻 的 和 为 
b 
S= 220-0 
=b+2(b-1) + 4(b —- 2) + 8(h — 3) + 16054) 4... 2 Z2 (1). (6.1) 
PSE 2 得 到 方程 
28 = 2b + A(b - 1) + 8G — 2) + I6(b — 3) +... + #01) (6.2) 
MET TERRAS.) 我们 发 现 , 非常 数 项 差不多 都 消去 了 , 例如 , 26 一 2(5 
- 1) 2 2, 4b ~ 1) - A(b — 2) = 4, 等 等 , 方程 (6.2) 的 最 后 一 项 2 在 方程 (6.1) 中 不 出 
现 ; 因此 , 它 出 现在 方程 46.3) 中 : 方程 (6.1) 中 的 第 一 项 hp 在 方程 (6.2}) 中 不 而 现 ; 办 此， 上 
HUE 7; (6.3), 我 们 得 到 
S=-bht+2+44 84+... +734 202 (#*!—1)- (b+ D (6.3) 
这 就 证 明了 该 定理 。 
SE 4 ft (complete tree) PEEL SUIS (perfectly binary tree), IEEE I ES SUB Ei AU 
- 棵 完全 树 的 节点 高 度 的 和 的 上 界 。 由 于 -- 棵 完全 和 树 节点 数 在 29 m 2^ cna], 因此 该 定理 意 
味 着 这 个 和 是 O(N), 其 中 N 是 节点 的 个 数 。 
虽然 我 们 得 到 的 结果 对 证 明 BuildHeap 是 线性 的 而 言 是 充分 的 , 但 是 高 度 的 和 的 界 部 不 
是 尽 可 能 的 强 。 对 于 具有 N = 2 个 节点 的 完全 笃 , 我 们 得 到 的 界 大 致 是 2N。 由 归纳 法 可 以 
W, BEDRE N 一 bON), Hob bp(N) 是 存 的 二 进 制 表示 法 中 1 的 个 数 。 


6.4 优先 队列 的 应 用 


我 们 已 经 提 到 优先 队列 如 何 用 于 操作 系统 的 设计 中 .. 在 第 9 章 , 我 们 将 看 到 优先 队列 如 何 有 
效 地 用 于 几 个 图 论 算法 的 实现 中 。 此 处 , 我 们 将 介绍 如 何 应 用 优先 队列 来 得 到 两 个 问题 的 解答 。 
6.4.1 选择 问题 

我 们 将 要 考察 的 第 一 个 问题 是 来 自 第 1 章 的 选择 问题 。 当 时 的 输入 是 N 个 元 系 以 及 一 
ARORA, SON 个 元 素 的 集 可 以 是 全 序 的 。 该 选择 问题 是 此 找 出 第 上 个 最 大 的 元 素 。 

在 第 1 章 中 给 出 了 两 个 算法 , 但 是 它们 都 不 是 很 高 效 的 算法 。 第 一 个 算法 我 们 将 称 其 为 
VA. FER RE EEA BUR IO v HET, 返回 适当 的 元 素 。 假 设 使 用 的 是 简单 的 排序 算 
法 ， 则 运行 时 间 为 O(N2)。 另 一 个 算法 叫做 1 B, 是 将 上 & 个 元 素 读 入 一 个 数组 并 将 其 排序 。 
文 些 元 素 中 的 最 小 者 在 第 个 位 置 上 。 我 们 一 个 一 个 地 处 理 其 余 的 元 素 。 当 一 个 正 秦 开始 艇 
处 理 时 ,性 先 与 数组 中 第 上 个 元 素 比 较 , 如 果 该 元 素 大 , 那么 将 第 个 元 素 除 去 , 面 这 个 新 
元 过 则 被 放 在 其 余 - 1 个 元 素 间 正确 的 位 置 上 。 当 算法 结束 时 , 第 & Mi LAUR me 
问题 的 解答 . 该 方法 的 运行 时 间 为 O(N-k)。( 为 什么 ?) 如 果 =[ NA21, 那么 这 两 种 算法 
部 是 ON?) 注意 , 对 于 任意 的 ,我 们 可 以 求解 对 称 的 问题 : 找 出 第 (N -k + 1) 个 最 小 
的 元 素 , 从 而 上 = 『N/21 实 际 上 是 这 两 个 算法 的 最 困难 的 情况 。 这 刚好 也 是 最 有 趣 的 情形 ， 
国 为 上 的 这 个 值 称 为 中 人 往 孝 (median)。 

我 们 在 这 里 给 出 两 个 算法 , 在 有 = 『N721 的 极端 情形 下 它们 均 以 OCN log NIE, A 
是 明显 的 改进 。 


算法 6A 
为 了 简单 起 见 , 假设 我 们 只 考虑 找 出 第 个 最 小 的 元 素 。 该 算法 很 简单 ,我们 将 N 个 元 
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KIEA -个 数组 然后 对 该 数组 应 用 BuildHeap BE. BG. 执行 有 & X DeleeMin 操作 。 从 该 
址 最 语 提 取 的 元 这 就 是 我 们 的 党 案 . GR TEE PE, 我 们 就 可 以 求解 原始 的 门 题 ， 
Rk PEACH | 

OP BE A ak Ev iA AE PAY GS H BuldHeap. 构造 堆 的 最 坏 情 形 用 时 是 
OCN), MERR DeleteMin 用 时 Oog N) BUTS 4 TX DeleteMin. 因此 我 们 得 到 总 的 运行 时 
"P, O(N + & lg ND, UR - OCGN og ND. I AiE E ROGA F BuildHeap ete | BD 
OON) ITAR k È. 运行 时 间 为 OC log N) WR -[NZ2;. HA RGUT BERI 
QN log ND, 

iE. QR B = NARESH ERR AA ic eee, BARI Ke 
于 世 经 对 输入 文件 以 时间 OCN log NOE SABRE. 在 第 7 ex, 我 们 将 细 化 该 想法 , 得 到 Ae 
过 的 排序 算法 , HU EAR BEAR Cheapsort ). 
算法 6B 

关于 第 2 个 算法 , 我 们 回 钙 原始 问题 , Rae PRAM CR 我 们 使 用 算法 1B SA 
Kk ddr -时 刻 我 们 都 将 维持 夫 PRA CRRA S EET &£ TOCHKA, EPHREAL, - 
DEELGE, BARGE k TRAR LETIH, WRA k TRARRE H Sio 注意， 
eic atte 如 华新 的 元 素 昌 大 、 WARATA SHAS, . 此 时 , S 将 有 一 
新 的 最 小 元 素 , EMER RS GEM OR, 也 可能 不 是 在 输入 终了 时 , RIERS S 中 最 小 
E HIRO, CRAT. 

这 基本 上 与 第 上 章 中 描述 的 算法 相同 不 过 , xx HARÍA] -个 堆 来 实现 S. B Rk oU 
素 通过 调用 一 次 BuildHeap 以 总 时 间 OORE ZAHER, 好 理 每 个 其 余 的 元 素 的 时 间 为 (1) — 190 
CRW FE ETEA SEU ET TE] Otlog 在 必要 时 删除 S. SA BURR) Bt. 总 的 时 问 
E Olk + (N - k)og &) = OUN log &) .该 算法 也 给 出 拷 出 中 位 数 的 时 同 界 OCN log N) 

1658 7 29, 我 们 将 看 到 如 何以 平均 时 间 OC N) 解 决 这 个 问题 - 在 第 10 zx. 我 们 将 次 到 - 
个 以 QCN) 最 坏 情形 时 间 求 解 该 问题 的 算法， AA OS RB 
6.4.2 事件 模拟 

在 3.4.3 节 我 们 描述 了 一 个 重要 的 排队 问题 . 在 那里 我 们 有 -一 个 系统 ,比如 纪行 顾客 
JEWS SERA BA EAB TE FORI & 个 出 纳 员 中 有 CELF, MESAN eE MEA Kk 
控制 .服务 时 间 ( - 旦 出 纳 员 腾 出 时 间 用 王 服 务 的 时 间 晤 ) 也 是 如 此 我 们 的 兴趣 在 二 一 位 最 
客 平 均 必 须 鉴 等 多 外 或 所 排 的 队伍 可 能 有 少 长 这 类 统计 问题 

对 于 莫 此 概率 分 布 以 及 的 一 些 值 , 答案 都 可 以 精确 地 计算 出 米 : 然而 随 者 夫 GER, 
分 析 明 并 地 变 得 困难 , 因此 使 用 计算 机 模拟 银行 的 运作 很 有 吸引 为 . 用 这 种 方法 , FRA 
可 以 确定 为 保证 合理 地 通畅 的 服务 需要 有 多少 出 纳 员 ， 

Eo d Ah f EAR. RABE SEE Ca) -位 磊 客 的 人 到达, 和 (Pb) 一 位 磊 客 的 府 
di, Mais di BEN Du 

我 们 可 以 使 用 概率 函数 来 生成 一 个 输 人 人流， Em Refit EAEI nA eee 

纠 上 二 并 通过 划 达 时 间 排 序 , 我 们 不 必 使 用 :天 中 的 准确 时 间 ， in ef RE PATS] ht. 称 之 
为 -个 滴答 {tick) : 

der ERHERU POTERE RA ORA AERE 我 们 让 钟表 BE? 

xx. I EE APRE. RT, HE A deli 2b PE UIT, 搜集 统计 资料 : 


这 种 模拟 策略 的 问题 是 ,， 它 的 运行 时 间 不 依赖 顾客 数 或 事件 数 ( 每 位 顾客 有 两 个 事件 )， 
但 是 却 依 赖 滴答 数 , 而 后 者 实际 又 不 是 输入 的 一 部 分 . 为 了 看 清 为 什么 问题 在 于 此 , 假设 将 
钟表 的 单位 改 成 滴答 的 于 分 之 一 (millitick) 并 将 输 人 中 的 所 有 时 间 素 以 1000, Ru Zt AGREE 
模 氢 用 时 长 了 1 000 f! 

避免 这 种 问题 的 关键 是 在 每 一 个 阶 般 让 钟表 直接 走 到 下 一 -个 事件 时 间 。 共 概念 上 看 这 古 
容易 做 到 的 。 在 任 一 时 刻 , 可 能 出 现 的 下 .一 事件 或 者 是 (a) 输 入 文件 中 下 一 顾客 的 到 达 , 或 者 
是 fb) 在 一 各 出 纳 员 处 一 位 顾客 离开 . 由 于 可 以 得 知 将 发 牛 事件 的 所 有 时 间 , A ERIE R 
找 出 最 近 的 要 发 生 的 事件 并 处 理 这 个 事件 

如 果 事 件 是 离开 , 那么 处 理 过 程 包 括 搜集 离开 的 顾客 的 统计 资料 以 及 检验 队伍 (队列 ) 看 
在 否 还 有 另外 的 顾客 在 等 待 。 如 果 有 ,那么 我 们 如 上 这 位 顾客 ,处 理 所 需 要 的 统计 和睦 料 ， 计 
SRM SCE, 并 将 离开 事件 如 到 等 等 发 生 的 事件 集中 去 。 

如 时 事件 是 到 达 , 那么 我 们 检查 闲 着 的 出 纳 员 。 如 果 没 有 , 那么 我 们 把 该 刘 达 事 件 放 到 
BEC BARI Hes 和 否则, 我 们 分 配 顾 客 一 个 出 纳 员 , 计算 顾客 的 离开 时 间 , 并 将 离 半 事件 如 
到 等 待 发 生 的 事件 集中 去 ， 

在 等 待 的 顾客 队伍 可 以 实现 为 一 个 队 讽 。 由 于 我 们 需要 找到 最 近 的 将 要 发 生 的 事件 , 合 
适 的 办 法 是 将 等 待 发 生 的 离开 的 集合 编 人 一 个 优先 队列 中 。 下 一 事件 是 下 一 个 到 达 或 下 一 个 
离开 (哪个 发 生 早 就 是 哪个 ); 它们 都 容易 达到 。 

为 覃 拟 编写 例 程 很 简单 , 但 是 可 能 很 耗费 时 间 。 如 果 有 C 个 项 客 { 因 此 有 2C 个 事件 /和 
个 出 纳 员 , 那么 模拟 的 运行 时 间 将 会 是 OUC log( + 1O, 因为 计算 和 处 理 每 个 事件 花 
费 O(log H), HHH = + 1 ARAP- 


6.5 chifé 


二 叉 堆 是 如 此 简单 ,以 至 于 它们 几乎 总 是 用 在 种 要 优先 队列 的 时 候 - dE COMER 
单 推广 , 它 怡 像 一 个 二 灵 堆 ,只 是 所 有 的 节点 都 有 d 个 儿子 (因此 , 二 叉 堆 是 2- 堆 )。 

图 6-19 表示 的 是 一 个 3- 玲 , 注意, a MEE HL OE TRA AE, 它 将 Insert 操作 的 运行 时 间 
改进 为 O{logs ND. 然而 , 对 于 大 的 d, DeleteMin 操作 费时 得 多 ， 因 为 虽然 树 浅 了 , 但 年 4 
个 儿子 中 的 最 小 者 是 必须 要 找 出 的 ,如 使 用 标准 的 算法 , 这 会 花费 4 - 1 次 比较 , 于 是 将 此 
操作 的 用 时 提高 到 Old log; N)。 如果 d 是 常数 ,那么 当然 两 种 操作 的 运行 时 间 者 是 
O(log N)。 虽 然 仍 然 可 以 使 用 一 个 数组 , 但 是 ， 现在 找 出 儿子 和 父亲 的 乘法 和 除法 都 有 个 因 
Td, 除非 a B28. 否则 将 会 大 大 地 增加 运行 时 间 ， 因为 我 们 再 不 能 通过 二 进 制 移 位 来 
空 现 除 法 了 。a- 堆 在 理 沦 上 很 有 趣 ,因为 存在 许多 算法 ,其 插入 次 数 比 DeleteMin 的 次 数 多 
很 多 (因此 理论 上 的 加 速 是 可 能 的 )。 当 优 先 队列 太太 不 能 完全 装 和 信 主 存 的 时 候 ，d- 堆 也 是 很 
右 用 的 。 在 这 种 情况 下 ，Q- 堆 能 够 以 与 B- 本 大致 相 同 的 方式 发 挥 作用 。 最 后 ， BS S, 
在 实践 中 4- MERI LAREXI — XE, 

除 不 能 执行 Find 外 , 堆 的 实现 的 最 明显 的 缺点 是 :将 两 个 堆 合 并 成 一 个 堆 基 困难 的 操 


O IH OCC log( b * Dm OCC log BOLLUR SS ko 1 AITEAL 


ABAD s 
VE. 这 种 附加 的 操作 而 做 MergeC QF). (REN BS LE AG Merge 操作 的 运行 时 间 
起 O(log N), 现在 我 们 就 来 讨论 二 种 复 来 程度 不 一 的 数据 结构 ,它们 者 有效 地 支持 Merge TR 
作 , 我 们 将 把 复 集 的 分 析 推 迟到 第 LL 草 讨论 。 
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6.6 ÆRE 


设计 一 种 堆 结构 像 二 叉 堆 那 样 高 效 地 支持 合计 操作 { 即 以 O CN HEB] RE FE 3X. Merge) 而 
及 只 使 用 :个 数组 做 乎 很 困难 。 原 内 在 于 ,合并 似乎 需要 把 - APES -个 数组 外 
上 .对 于 相同 天 小 的 堆 这 将 花费 时 间 ON) 正 因 为 如 此 ， 所 有 支持 高 效 合 并 的 疝 级 数据 结 
构 部 需要 使 用 指针 SEC. 可 能 我 们 预计 这 将 使 得 所 有 其 他 的 操作 此 慢 ; 处 理 指针 - MEE 
用 2 eee AIA E FE Oe TTA] o 

像 一 叉 堆 那样 ， 左 式 堆 (lcitist heap) 也 有 具有 有 结构 特性 和 有 有 序 性 : BSE, AA TB 
RE, 去 式 堆 具 有 相同 的 玲 序 性 质 , 该 性 盾 我 们 已 经 看 到 过 ,不 仪 如 此 ， 丰 式 堆 也 是 二 又 树 。 
左 式 维和 二 丸 树 间 惟 一 的 区 别 是 ; 左 式 叭 不 是 理想 平衡 的 (pcrfectly balanced). TES as Abas 
向 于 非常 不 平衡 。 
6.6.1 ZAHEER 

我 们 把 他 一 节点 X 09:348 Y (null path length, NPL) Npl CX )g LIA, X 88. PRA 
两 个 儿子 的 节点 的 最 短路 径 的 长 ,因此 ,具有 个 或 上 个 儿子 的 节点 的 Nb JO. 
Npi(NULL) = — 1. 在 图 6-20 的 树 中 , SRR KECE REY TA 
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注意 , 任 一 节点 的 零 路 径 长 比 它 的 诸 儿 子 节点 的 零 路 径 长 的 最 小 但 多 1; Pes ie hk 
用 少 于 上 项 个 儿子 的 节点 , 因为 NULL FRERE- 1. 

EREEREER: 对 于 堆 中 的 每 一 个 节点 X, SULTS KB 5d LFS Ria IC ^ 
RE, 几 6-20 中 只 有 一 棵 树 ( 即 左边 的 那 棵 树 ) 满 是 该 性 质 。 这 个 性 质 实 际 上 超出 了 它 确保 树 人 不 


平衡 的 要 求 ， 内 为 它 显 然 更 任 重 于 使 树 向 左 增加 深度 。 确实 有 可 能 存在 由 左 广 点 形成 的 长 路 径 

构成 的 树 (而 且 实 际 直 更 便于 合并 操作 ) 一 一 因此 , 我 们 就 有 了 去 式 礁 (leftist heap) 这 个 名 称 。 
BLA Ac EGER PAL DR ZEE e. 所 以 右 路 径 应 该 短 。 ARE, 沿 左 式 堆 的 石 路 和 经 确实 是 

以 堆 中 最 短 的 路 径 。 否则 , 就 会 存在 一 条 路 从 通过 某 个 节点 区 并 取得 左 儿 子 。 此 时 和 则 破坏 


了 『 左 式 堆 的 性 质 -。 
定理 6.2 
在 右 路 径 上 有 7 个 节点 的 左 式 树 必 然 至 少 有 2 上 个 节点 。 
WERE : 
数学 归纳 法 证 明 , 如 果 > = 1, 则 必然 至 少 存 在 一 个 树 节点 。 另 外 , 设 定理 对 1、2,，...、 


r 个 节点 成 立 。 考虑 在 右 路 径 上 有 + 1 个 节点 的 左 式 树 。 此 时 , 根 具 有 在 右 路 径 工 会 了 个 
特点 的 右 子 树 , 以 及 在 右 路 径 上 至 少 全 > 个 节点 的 左 子 树 ( 和 否则 它 就 不 是 左 式 树 )。 对 这 两 条 
子 树 应 用 归纳 假设 , 得 知 在 每 标 子 树 上 上 最少 有 2' 一 1 个 节点 , PEU ERR, 于 是 在 该 树 上 
至 少 有 2- 1 个 节点 , BE. 

从 这 个 定理 立刻 得 到 ，N 个 节点 的 左 式 树 有 一 条 右 路 径 晤 多 含有 Llog (NDI DA. 对 
左 式 堆 操 作 的 一 般 思 路 是 将 所 有 的 工作 放 到 右 路 径 上 进行 ， 它 保证 树 深 短 。 惟一 的 棘手 部 分 企 
T, AFTARA Insert 和 Merge 可 能 会 破坏 左 式 堆 性 质 。 事 实 上 , 恢复 该 性 质 是 非常 容易 的 。 
6.6.2 左 式 堆 的 操作 

对 左 式 崔 的 基本 操作 是 合并 , 注意 , 搬 人 只 是 合并 的 特殊 情形 ,因为 我 们 可 以 把 所 人 看 
成 是 单 节点 堆 与 一 个 太 的 堆 的 Merge. 首先 , 我 们 给 出 一 个 简单 的 递归 解法 , 然后 介绍 如 何 
能 够 非 递 妇 地 施行 该 解法 。 我 们 的 输入 是 两 个 左 式 堆 Hi 和 Ho. 见 图 6-21。 读 考 应 废 验证 ， 
这 些 堆 确实 是 左 式 推 。 注意, 最 小 的 元 素 在 根 处 。 队 数据 、 左 指针 和 右 指针 所 用 空间 外 , 每 个 
单 扰 还 要 有 一 全 指示 零 路 径 长 的 项 - 





图 6-21 两 个 左 式 堆 A, HH; 


如 果 这 两 个 堆 中 有 一 个 堆 是 空 的 , 那么 我 们 可 以 返回 另 外 -个 堆 。 和 否则, 为 了 合并 这 两 
ME, 我 们 需要 比较 它们 的 根 。 BIG. 我 们 将 具有 大 的 根 值 的 堆 与 具有 小 的 根 值 的 堆 的 太子 
堆 合 并 ， 在 本 例 中 , 我 们 递归 地 将 H; 5H, 中 根 在 8 处 的 丰 子 堆 合并 , 得 到 图 6-22 中 的 堆 。 

由 于 这 棵 树 是 递归 地 形成 的 ， 而 我 们 尚 末 对 算法 措 述 完毕 因此 ， 我 们 现在 还 不 能 说 明 
Me EAT a. 不 过 , 有 理由 假设 , 最 后 的 结果 是 一 榜 左 式 淮 ， 因为 它 优 通过 递归 的 步 
PRIE SLA. Sac TBR ISAS HEAR P A UPA Ti E o FSR (| 18E ERE BA EE CA "E (E ERE 
TE BH MR), ESR AT EM, EESTI TLTAE2 7E Jp DRACO S za 
3, 我 们 在 第 1 章 中 讨论 过 它 。 现在, 我 们 让 这 个 新 的 堆 成 为 Hi Fs AD Ar JL COLES 6-23). 
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图 6-23 Hi El 622 中 的 左 式 堆 作 为 右 儿 了 的 结 乐 


虽然 最 后 得 到 的 堆 满足 玲 序 性 质 , 但 是 , 它 不 是 左 式 堆 , 因为 根 的 左 子 树 的 零 路 径 攻 为 i 
而 根 的 右 子 树 的 零 路 径 长 为 2。 因此, 左 式 的 性 质 在 根 处 被 人 破坏。 不过， 容易 看 到 , 树 的 其 余部 
分 必然 是 左 式 的 。 由 于 递归 步骤 , BHAT BAR, 根 的 左 子 树 没有 变化 ,当然 七 也 必然 还 
是 去 式 的 。 这样 一 来 , 我 们 只 要 对 根 进行 调整 就 可 以 了 . 使 整个 树 是 左 式 的 做 法 如 下 : 只 要 交换 
根 的 左 儿 子 和 右 儿子 (图 6-24) 并 更 新 零 路 径 长 , 就 完成 了 Meme, 新 的 零 路 径 长 是 新 的 右 儿 子 
的 零 路 径 长 加 1。 注意 , 如 果 零 路 径 长 不 更 新 , 那么 所 有 的 零 路 径 长 都 将 足 8， 而 排 将 不 是 左 部 
的 ,只 是 随机 的 。 在 这 种 情况 下 ,等 法 仍然 成 立 , 但 是 , 我 们 宣称 的 时 间 界 将 不 再 有效。 





图 6-24 ”交换 Hi 的 根 的 儿子 得 到 的 结 素 


8 


Hee BTA EERIE RRS. ATE Np SRE K) ao}, 算法 中 的 类 型 定义 ! 图 
6-25) 与 二 叉 树 是 相 则 的 . 我 们 在 第 4 音 已 经 看 到 ， 当 一 个 元 素 被 插入 到 一 棵 空 的 二 叉 树 时 ， 
需要 改变 指向 根 的 指针 。 最 容易 的 实现 方法 是 让 桂 人 例 程 返回 指向 新 树 的 指针 , TERT ES, 
这 将 使 得 左 式 堆 的 Insert $M HEAY Insert 不 兼容 (后 者 什么 也 不 返回 )。 图 6-25 的 最 后 一 行 
描述 了 捍 脱 这 种 窘境 的 一 种 方法 .。 返回 新 树 的 堪 式 堆 播 人 例 程 将 记 为 Insertl; E Insert 将 完 
MK Go MERA ARE, 这 种 使 用 宏 的 方法 可 能 不 是 最 好 和 最 安全 的 做 法 , 但 为 一 
种 方法 即 把 PriorityQueue 声明 为 指向 TreeNode KISS. RUE RA TRU RES. U 


#ifndef _LeftHeap_H 


struct TreeNode; 
typedef struct TreeNode *PriorityQueug; 


/* Minimal set of priority queue operations */ 

/* Note that nodes will be shared among several */ 
/* leftist heaps after a merge; the user must */ 
/* make sure to not use the old leftist heaps */ 


PriorityQueue Initialize( void 3; 

ElementType FindMin€ PriorityQueue H J; 

int IsEmpty( PriorityQueue H }; 

PriorityQueue Merge( PriorityQueue H1, PriorityQueue H2 5; 


#define Insert X, HY C H = Inserti (X 2, H 3 2 
/* DeleteMin macro 7s left as an exercise */ 


PriorityQueue Insertl( Elementlype X, PriorityQueue H ); 
PriorityQueue DeleteMinl( PriorityQueue H ); 


s endi f 


/* Place in implementation File */ 
struct freeNode 
1 


ElementType Element; 
PriorityQueue Left; 
PriorityQueue Right; 
int Mpt; 





图 6-25 左 式 堆 类 型 声明 


因为 Insert 是 一 个 宏 并 自 将 被 预 处 理 程序 替换 ,所 以 任何 调用 Insert 的 例 程 必须 能 够 匈 
到 宏 定义 。 图 6.25 为 一 个 典型 的 头 文件 , 将 宏 声 明 放 在 那里 是 惟一 合适 的 办 法 。 后 面 将 会 看 
到 ,DeleteMin 也 需要 写成 宏 的 形式 。 
合并 操作 的 例 程 (图 6-26) 是 一 个 被 设计 成 除去 一 些 特殊 情形 并 保证 H, A BAVA R 
例 程 。 实 际 的 合并 操作 在 Mergel 中 进行 (图 6-27). 注意 , 原始 的 两 个 左 式 堆 绝 不 要 再 使 用 ; 
它们 本 身 的 变化 将 影响 合并 操作 的 结果 ， 
搞 行 合并 的 时 间 与 右 路 径 的 长 的 和 成 正比 , 因为 在 递归 调用 期 间 对 每 一 个 被 访问 的 六 点 
执行 的 是 常数 工作 量 。 因此 , 我 们 得 到 合并 两 个 左 式 堆 的 时 间 界 为 O(log ND. 我 们 也 可 以 分 
两 超 来 非 递 归 她 实施 该 操作 。 在 第 一 趟 , 我 们 通过 合并 两 个 堆 的 右 路 径 建 立 RAR. A 
此 , 我 们 以 排序 的 顺序 安排 H M H 右 路 径 上 的 节点 , 保持 它们 各 自 的 左 几 子 不 变 . 在 我 们 
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的 重子 中 ， SEPA 3, 6, 7, 8, 18, MAREE A ES 6-28 中 . 35 ae he BLAME, 
儿 下 的 交换 工作 在 看 式 堆 性 质 被 破坏 的 那些 告 点 下 进行 - 在 网 6-28 "B, 在 节点 7 和 3 有 -次 
变换 ， 并 得 到 与 前面 相同 的 树 : 韭 递 归 的 做 法 忠 容 易 理解 , 但 编程 困难 。 TETTE] EIER INE 
WY 递归 这 程 和 和 非 递 归 讨 程 的 结果 是 相隔 的 


一 


Priori tyQueue 
Merged PriorityQueue Hl, PriorityQueue H2 } | 


poss ifC H1 == NULL ) 


j^ 2*f return H?; 
A if H2 == MULI 5 
1 fv dt if return Hl; 
f* SS, iff Hi-»Element < H2--Element 3 
| f* "F return Mergel( Hi, H2 3; 
else 
/* Ff return Mergel( H2, Hl 3; 


[] 6-26 AJ ERIE R SHITE 
MEME 


static PriorityQueug 

Mergel( PriorityQueue H1, PriorityQueue H2 ) | 
i 
A l*/ iff Hl-»Left -= NULL 3 /* Single node */ | 


l 
PP LH Hi-»Left = H2; /* Hi->Right is already NULL, 
| Hl--Npl is already Ù */ 
| else | 
{ 1 
| ft 3*/ H1->Right = Merge( Hl--Right, H2 }; i 
fe arf ift HL eLeft-aNpl < Hi-sRight->Npl 7 | 
| JE SE SuapChildren£ H1 3}; 
| /* By Hi-»Npl = Hl1-»Right-»Npl + 1; | 
! 
A FF return Hi; 


图 6-27 AH UE ag sc DTE 
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图 .28 SHH, HH HERE 


二 而 提 到 ,我 们 村 以 通过 把 被 插入 项 看 成 单 节点 堆 并 执行 -- 次 Merge 来 完成 插入 。 为 了 
HAS DeleteMin, FL B REI dL GEBURT TOR, 然后 再 将 这 两 个 堆 合并 。 因此, 执行 一 次 
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DeleteMin 的 时 间 为 O(log N)。 这 两 个 例 程 在 图 6-29 利 图 6-30 中 给 出 。 DeleteMin 可 以 写成 
E., 它 调用 DeleteMinl 和 FindMin. 我 们 把 它 留 作 读 者 的 一 道 练习 题 。 





PriorttyQueue 
Inserti¢ ElementType X, PriorityQueue H ) 
| 


PriorityQueue 5ingleNode; 


/* 1*7 SingleNode = malloc( sizeof( struct TreeNode J >; 
| f* 2*/ if( SingleNode == NULL ) 
/* 3*/ FatalError( “Out of space!!!" J; 
else 
{ 
/* 4*/ SingleNode->Element = X; SingleNode-»Npl = 9; 
f* 5*7 SingleNode->Left = SingleNode->Right = NULL; 
| f* Bry H = Merge( SingleNode, H ); 
} 
| f/* F*/ return H; 
i 


图 629 FORE A 


/* DeleteMinl returns the new tree; */ 
/* Ta get the minimum, use FindMin */ 
/* This is for convenience */ 


DeleteMinl( PriorityQueue H 3 


PriorityQugue 
PriorityQueue LeftHeap, RightHeap; 
l 


f* i*/ if¢ IsEmpty( H 2 2 
ft As | Error( "Priority queue is empty" 3; 
/* 3*/ return H; 
} 
| /* g*r LeftHeap = H-»Left; 
f/* 5*/ RightHeap = H--Right; 
A 6*/ free( H j; 
y^ ?*/ return Merge( LeftHeap, RightHeap j; 


F 





6-30) 左 式 堆 的 DeleteMin 例 程 


最 后 , 我 们 可 以 通过 建立 一 个 二 叉 堆 (显然 用 指针 实现 ) 而 以 O(N) 时 间 建 立 一 个 左 式 
Kt. 尽管 二 叉 堆 显然 是 左 式 的 , 但 它 未 必 是 最 住 解决 方案 , 因为 我 们 得 到 的 堆 可 能 是 最 差 的 
AGUE. 不 仅 如 此 ,以 相反 的 层 序 遍 历 树 也 不 像 用 指针 那么 容易 。BuildHeap 的 效果 可 以 通过 
递归 地 建立 左右 子 树 然 后 将 根 下 滤 而 得 到 。 练习 中 包括 另外 一 个 解决 方案 。 


6.7 HË 


4138 (skew heap) 是 左 式 堆 的 自 调节 形式 , 实现 起 来 极其 简单 。 斜 堆 和 左 式 堆 间 的 关系 类 
似 于 伸展 树 和 AVL 笃 间 的 关系 。 gi E E MEER BS CUBE, 但 是 不 存在 对 树 的 结构 限制 。 不 
IET AXE, 关于 任意 节点 的 零 路 径 长 的 任何 信息 都 不 保留 。 ADEBLE RE t TE AE aT Z0] AB RT 
以 任意 长 , 因此 , 所 有 操作 的 最 环 情形 运行 时 间 均 为 O(N). m, iE AD IR] fH REI RE. BT 
证 明 ( 见 第 11 章 ) 任 意 M 次 连续 操作 , 总 的 最 环 情形 运行 时 间 是 OM log N) 因此 , RUERE 
次 操作 的 摊 还 时 间 (amortized cost) 为 O(log Noo 


AFI CB) 5 

要 在 式 扒 相同 , 糙 堆 的 基本 操作 也 是 合并 操作 : 这 个 Merge 例 往 还 是 递归 的 , 我 们 执行 
与 以 前 完全 相册 的 操作 ,但 有 一 个 例外 ,， 即 : FELE, IRINA eO AL FRAIL 
足 左 式 堆 堆 序 性 质 并 交换 那些 不 满足 该 性 质 者 : 但 对 于 和 斜 堆 ， 除 了 这 些 有 路 答 上 所 有 有 HADI 
晤 大 者 不 交换 它们 的 左右 儿子 外 ,交换 是 无 条 件 的 - 这 个 俩 让 就 是 在 自然 通 归 实现 时 所 发 生 
的 现象 , 因此 它 实 际 上 根本 不 是 特 中 人 情形- 不 仪 如 此 ， 污 明 时 辣 界 也 是 小 必要 的 , 但 是 ,出 于 


该 节点 肯定 没有 右 儿子 , AIRE BEES. CORINA SE, wa ILE, 因此 [198 


我 们 椒 必 为 此 担心 。) 男 外 , UFR A IE I BOE, SLES 6-31. 
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图 6-32 E H. E H, 的 看 子 堆 合 并 的 结案 


这 也 是 递归 地 完成 的 , 因此, 根据 递归 的 第 二 个 法 则 (所 1.3 节 ) 我 们 不 必 担 心 它 基 如 何 
得 名 和 的。 这 个 堆 碰 巧 是 左 式 的 ,不 过 不 能 保证 情况 总 是 如 此 。 我 们 使 这 个 堆 成 为 H 的 新 的 
AJL, mi H, 的 老 的 左 儿 子 变 成 了 新 的 在 儿 疗 ( 见 图 6-33). 

整个 树 是 左 式 的 , 但 是 宁 易 看 到 这 并 不 总 是 成 立 的 : 将 15 横 人 到 新 堆 中 将 破坏 左 式 性 质 ， 

我 们 也 可 像 左 式 座 那样 非 递归 地 进行 所 有 的 操作 : 合并 右 路 径 , 除 最 后 的 节点 外 父 换 右 
路 径 上 每 个 节点 的 左 儿 子 和 右 儿子 。 经 过 几 个 例子 之 后 ， SRA ia: m PER ENT 
于 最 后 的 站点 外 的 所 有 节点 都 将 它们 的 儿子 交换 , 因此 最 终 效 采 让 EUR TRH AREAS 

Tat AO DEG E CLA C «co IL OH TREE K jb TEE. 
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区 6-33 GHEHE H 和 EL, 的 结果 


斜 堆 的 实现 留 作 练 习 。 ER, 因为 右 路 径 可 能 很 长 , 所 以 递归 实现 可 能 由 于 缺乏 栈 空 间 
而 失败 ， 昌 然 在 其 他 方面 性 能 是 可 接受 的 。 斜 堆 有 一 个 优点 ， 即 不 需要 附加 的 空间 来 保 备 路 
径 长 以 及 不 需要 测试 确定 何 时 交换 儿子 。 精 确 确 定 左 式 堆 和 斜 堆 的 期 望 的 右 路 径 长 是 一 个 疝 
本 解决 的 问题 (后 者 无 疑 更 为 困难 )。 这 样 的 比较 将 蝎 容易 确定 半 衡 信息 的 轻微 址 失 是 合 可 由 
缺少 测试 来 补偿 。 
6.8 二 项 队列 


虽然 堪 式 堆 和 斜 堆 每 次 操作 花费 O(log N) 时 间 , 这 有 效 地 支持 了 合并 . AM 
DeleteMin, 但 还 是 有 改进 的 余地 ， 因 为 我 们 知道 , 二 义 堆 以 每 次 操作 花费 常数 半 均 时 间 支 持 
A, 二 项 队列 支持 所 有 这 三 种 操作 , 每 次 操作 的 最 坏 情形 运行 时 间 为 O(log N), mind A3& 
作 平 均 花 费 常 数 时 间 。 
6.8.1 二 项 队列 结构 

二 项 队列 (binomial queue) 不 同 主 我 们 已 经 看 到 的 所 有 优先 队列 的 实现 之 处 在 于 ,一 个 二 项 
队列 不 是 一 棵 堆 序 的 树 ， 而 是 堆 序 树 的 集合 ， 称 为 春 林 (ferest)。 堆 序 树 中 的 每 一 栋 部 是 有 约束 
的 形式 , 叫做 二 项 树 (binomial tree, 后 面 将 看 到 该 名 称 的 由 来 是 显然 的 )。 TROUPE ILES 
在 一 栋 二 项 树 。 高 度 为 0 的 二 项 笃 是 一 棵 单 节点 树 ; 高 度 为 & 的 二 项 树 及 通过 将 一 棵 二 项 本 
Bo- | 附 接 到 另 一 棵 二 项 树 B, _ REMAR. 图 6- 34 显示 二 项 树 Bo, Bo Ba B 以 及 Bio 


a 


B, 


Fl 6-34 二 项 树 Bs. Bis Bo. B3 PAR Bag 
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MEHEL BIB, 由 - -个 带 有 儿子 B Bis... Bie UAB. AEA EU] LO 
树 恰 好 有 有 25 个 基点 ,而 存 深度 4 处 的 节点 数 是 -项 系数 | |. 如 果 我 们 把 堆 序 施 加 到 一 项 树 


上 并 允许 任意 高 度 上 最 多 有 一: 棵 二 项 树 ， 那 么 我 们 能 镶 用 一 项 树 的 集合 惟 :地 表示 任意 大 小 
的 优先 队列 例如， 大 小 为 13 的 优先 队列 可 以 用 森林 B3, Ba, Bo ER. RITI SA 
RAR OL, 它 不 仪 以 二 进 制 表示 了 13, MADARA ASE: TE LIRR, Bi, Bz, 
Bo 出现, 而 p, WRA. 

作为 一 个 例子 ,六 个 元 素 的 优先 队 人 可 以 表示 为 图 6-35 中 的 形状 。 
6.8.2 二 项 队列 操作 

此 时 , 万 小 元 可 以 通过 搜索 所 有 的 树 的 根来 找 出 由 于 最 多 有 log N 棵 不 同 的 树 ， 内 此 
最 小 二 可 以 时 间 OUog N) 找 到 。 另 外 , 如 果 我 们 记 住 当 最 小 元 在 其 他 操作 期 间 灾 化 时 更 新 
qz. 那么 我 们 也 可 保 角 最 小 元 的 信息 并 以 OC) 时 间 执 行 该 操作 

合并 其 个 二 项 队列 的 操作 在 概念 上 是 容易 的 操作 ,我们 将 递 过 例子 描述 。 考虑 两 个 一 项 
MSH ADA, 它们 分 别 上 共有 六 个 和 七 个 元 素 ， 见 图 6- 36。 

合并 操作 基本 上 是 通过 将 两 个 队列 加 到 一 起 来 完成 的 - 令 Hy 是 新 的 二 项 队列 - A A, 
没有 高 度 为 0 的 二 项 树 而 HA. 因此 我 们 就 用 五 - 中 高 度 为 0 的 二 项 树 作为 Ha B5 EAS 
然后 , REA Tres HE 1 的 二 项 树 相 加 - 由 于 万; AA, 都 有 高 度 为 1 的 二 项 树 ， 因 此 我 们 
可 以 将 它们 全 并, 让 大 的 根 成 为 小 的 根 的 子 树 ， 从 而 建立 高 伐 为 过 的 二 项 树 ， 见 图 6-37, 这 
E, H 将 没有 高 度 为 1 的 二 项 树 . 现在 存在 三 襟 高 度 为 2 的 一 项 树 , 即 H, 和 Ho 原 有 的 两 
个 一 项 树 以 及 由 上 一 步 形 成 的 一 栋 一 项 和 峙 . 我 们 将 一 标高 度 为 2 的 二 项 树 放 到 Hy P. 并 个 
{LAM POO, 得 到 一 棵 高 度 为 3 的 .项 树 . 由 于 Ha, 和 Ho 部 没有 高 度 为 3 的 二 项 树 ， 
因此 该 二 项 树 就 成 为 H 的 一 部 分 ,合并 结束 . 最 后 得 到 的 二 项 队列 如 图 6-38 所 水 。 


B 
fry: 
g 51 124 


87 
53] 
“16 “14 
[5 12 13 14 23 
H n, Q3 
ila 24 7 5d 26) 16 
MC oun 
= 
s E 
635 ”具有 六 个 元 率 的 图 6-36 两 个 二 项 队列 H 利 H, Fl6-37 H, AH. 中 
一 项 树 H 两 棵 Bi 树 合并 
门 3 (23 d D -- 
dM CARO ESO HD 
Mor Mo o MOA _ M Au 
"OA. "6m nere 
Vo 一 Mo NA 


图 638 JR Ic SH, WA, 的 结束 
FLEE VE ES BY ET HE IT, m] ERST E 
O Clog N) 棵 二 项 树 ， 因此 合并 在 最 坏 情形 下 花费 时 间 O(log N)。 为 使 该 操作 更 高 效 . 我 们 
绊 点 将 这 些 树 放 到 按照 高 度 排 序 的 二 项 队列 中 , 当然 这 做 起 来 是 件 催 单 的 事情 。 
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插入 实际 上 就 是 特殊 情形 的 合并 , 我 们 只 要 创建 一 棵 单 节点 树 并 执行 一 次 合并 。 这 种 操 
作 的 最 坏 情 形 运 行 时 间 也 是 O(log N). 更 准确 地 说 ,如 果 元 素 将 要 插入 的 那个 优先 队列 中 
不 存在 的 最 小 的 二 项 树 是 B, 那么 运行 时 间 与 i+1 成 正比 。 例如 , ACA 6-38) RR EON 
1 的 二 项 树 , 因此 插入 将 进行 两 步 而 终止 。 由 于 二 项 队列 中 的 每 棵 树 出 现 的 概率 均 为 17 2, 
于 是 我 们 期 望 插入 在 两 步 后 终止 , 因此 , 平均 时 间 是 常数 。 不 仅 如 此 , 分 析 将 指出 , 对 一 个 初 
始 为 空 的 二 项 队列 进行 N 次 Insert 将 花费 的 最 坏 和 情形 时 间 为 O(N)。 事实 上 , 只 用 N - 1 
次 比较 就 有 可 能 进行 该 操作 ; 我 们 把 它 留 作 练 习 。 

作为 一 个 例 于 , 我 们 用 图 6-39 到 图 6-45 演示 通过 依 序 插入 1 到 7 来 构成 一 个 二 项 队列 。 
4 的 插入 展现 一 种 坏 的 情形 。 我 们 把 4 与 Bo 合并 , 得 到 一 棵 新 的 高 度 为 1 的 树 。 然 后 将 该 树 
与 B, 合并 , 得 到 一 标高 度 为 2 的 树 , 它 是 新 的 优先 队列 。 我 们 把 这 些 算 作 三 步 ( 两 次 树 合并 
加 上 终止 情形 ), 在 插入 7 以 后 的 下 一 次 插入 又 是 一 个 坏 情形 , 需要 三 次 树 合并 操作 。 


> A 2% 


图 6-39 在 1 插入 之 后 图 640 在 2 插入 之 后 图 5-41 ESAS 图 6-42 在 4 捅 人 之 后 


BEA" 


图 6-43 在 5 插入 之 后 图 6-44 在 6 插入 之 后 6-45 ETAZ 


DclcteMin 可 以 通过 首先 找 出 一 棵 具有 最 小 根 的 二 项 树 来 完成 。 令 该 树 为 Bo 并 令 原 妨 
的 优先 队列 为 H, 我 们 从 H 的 树 的 森林 中 除去 二 项 树 BL, 形成 新 的 二 项 树 队 列 H 再 除去 
B, 的 根 , 得 到 一 些 二 项 树 By, By, ..., Be -它们 共同 形成 优先 趴 列 H^» OP HAA, 
操作 结束 。 

作为 例子 , 设 对 Ha 执行 一 次 DeleteMin, 它 在 图 6-46 中 表示 。 最 小 的 根 是 12, 因此 我 们 
得 到 图 6-47 和 图 6-48 中 的 两 个 优先 队列 HOR. AS 和 地 得 到 的 二 项 队列 是 最 后 的 
答案 , 见 图 6-49 所 示 。 





图 6-46 二 项 队列 H 


p CD Q4) © 
nË 
(65) (D 


图 6.47 ”二 项 队列 H, SBR Bs 外 H 中 所 有 的 二 项 树 图 6-48 二 项 队列 H: 除去 12/88) By 
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图 6-49 Delere Mint H3 2] 2d 


为 了 分 析 ， 首先 注意 ，DeletcMin 操 件 将 原 二 项 队列 一 分 为 二 。 3E UB US Ie CORREA 
创建 队列 HOM A HE BT TB] O Clog N)。 合并 这 两 个 队列 又 花费 O(log Nomplal, 内 此 , 整个 
DeleteMin 操作 花费 时 间 O Clog N) - 

6.8.3 二 项 队列 的 实现 

DeleteMin 操作 需要 快速 找 击 根 的 所 有 子 树 的 能 力 ， 因此 , FRA HE RS 
每 个 节点 的 弟子 都 存在 -个 链表 中 , 而 且 每 个 节点 都 有 一 个 指向 它 的 第 一 个 儿子 (如 采 有 的 
话 ) 的 指针 . 该 操作 还 要 炒 : 诸 儿 子 按照 它们 的 子 树 的 大 小 排 译 ,我 们 也 寡 此 保证 能 够 很 容 易 
地 合并 画 标 树 ， 当 两 棵 树 被 侣 并 时 ， 其 中 的 一 棵 树 作 为 儿子 被 加 到 另 一 棵 树 上 .. d Fix BU 
树 将 是 最 大 的 子 树 . 因此 ,以 大 小 递减 的 方式 保持 这 些 子 树 是 有 意义 的 - 只 有 这 时 ,我们 才 
能 够 有 效 好 合并 两 棵 “二 项 树 众 而 合并 两 个 二 项 队列 . 二 项 队列 将 是 二 项 全 的 数 织 ， 

BS: 二 项 树 的 每 一 个 节点 将 包含 数据 、 第 一 个 几 子 以 及 在 兄弟 。 二 蔗 酝 中 的 语 儿 六 以 
3B CA BEA; 

图 6-51 解释 如 何 表示 图 6-50 路 的 二 项 队列 。 图 6-52 显示 :项 树 中 的 节点 的 类 型 声明 - 


g O (23) (12) 
(I 


8 


图 6-50 iti CRRA TAWA a H, 





6-5] UTA) H, 的 表示 方式 


为 了 合并 两 个 二 项 队列 , RAS PARRA HATA ORT, 图 6-53 指出 
两 个 二 项 树 合 并 时 指针 是 如 何 变 化 的 。 合并 二 项 树 的 程序 很 简单 ， 见 图 6-54. 

现在 我 们 介绍 Merge 例 程 的 简单 实现 。 该 例 程 将 Hi 和 Ho 合共， 把 合并 结果 放 入 Hy 
rh FON Hy. 在 任意 时 刻 我 们 在 处 理 的 是 牧 为 i 的 那些 树 。Ti M T 分 别 是 H 和 H P 
的 树 . mi Carry 是 从 上 一 步 得 来 的 树 ( 可 能 是 NULL). UR T, ftit, WAL! Ted. 


IH eee HOF 


Mt! T, #20, 对 其 余 的 树 也 是 如 此 . SRA i 以 及 秩 为 i + 1 的 Carry 树 所 得 到 的 结果 形 
成 的 树 ， 其 形成 过 程 依 赖 于 8 和 神 可 能 情形 中 的 每 一 种 。 该 过 程 从 牧人 间 开始 到 产生 三 项 队 介 的 
最 后 的 秩 。 程序 见 图 6-55. 

二 项 队列 的 DelereMin 例 程 在 图 6-56 中 给 出 

当 受 到 影响 的 元 素 的 位 置 已 知 时 , 我 们 可 以 将 二 项 队列 扩展 到 冯 持 二 叉 堆 了 所 允许 的 某 些 
非 标准 的 操作 , 诸如 DecreaseKey 和 Delete, DecreaseKey 是 一 次 PercolateUp, RFRA 
个 城 加 到 每 个 节点 上 指向 上 其 父亲 , 那么 PercolateUp 可 以 时 间 Oog NN}) 完 成 ,一 次 任意 的 
Delete 可 以 通过 DecreaseKey 和 DeleteMin 以 时 间 O Clog N) 结 合 而 完成 。 


typedef struct BinMode *Fosition; 
typedef struct Collection *BinQueue; 


struct BinNode 
{ 


ElementType Element; 
Position LeftChi 1d; 
Position NextSibling; 


H 


struct Callection 
{ 
int CurrentSize; 
BinTree TheTrees[ MaxTrees ]; 





} 


6-52 二 项 队列 类 型 声明 
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图 6-S3 合并 两 棵 二 项 树 


/* Return the result of merging equal-sized T1 and T2 */ 


BinTree 
CombineTrees( Bintree TL, Bintree T2 j 


i 


if€ Tl-»Element > T2->E}ement ) 
return CombineTrees¢ T2, T1 }; 

T2->NextSibling = T1->Laftchiid; 

Ti-»LeftChild = T2; 

return T1; 





图 6-54 合并 同样 天 小 的 两 棵 二 项 树 的 例 程 


f£ 3E A BY (38 ) 


Imm 
| /* Merge two binomial queues */ 


/* Not optimized for early termination */ 
/* Hi contains merged result */ 


Bi nQueue 

Merge( BinQueue H1, BinQueue He ) 

1 
Bintree Ti, TZ, Carry = NLLL; 
int i, j; 


iff Hi-»CurrentSize + He-»CurrentSize > Capacity 2 
Error( "Merge would exceed capacity" ); 


Hi->CurrantSize += HM2-»Currentáiize, 
for( i = 0, 1 = 1; j <= Hi-sCurrentSize; 14+, j *= 2 3 


| 
| 
| 
| 
Ti = H1->TheTrees[ i ]; T2 = H2-»TheTrees, i ]; | 


l 
switchi !!Tl + 2 lIT2 + 4 * Hidarry 了 
i 
case D: /* ho trees */ 
case 1: /* Only Hi */ 
break: 
case 2; /* Only H2 */ 
Hl-»Thefrees[ i ] = Tz; 
H?-»IheTreesí à ] = MULL; 
break; 
case 4; /* Only Carry */ 
H1-»TheTrees[ i ] = Carry; 
Carry = NULL; 
break; 
case 3: /* Hl and H2 */ 
Carry = ComhbineTrees( TI, T2 ); 
Hi->Thelrees{ i ] = H2-»TheTrees[ i 1 = NULL; j 
break: 
Case 5: /* Hl and Carry */ 
Carry = CombineTrees( T1, Carry 3 
| Hi-»TheTrees[ à ] = MULL; | 
break; 
case b: /* H2 and Carry */ | 
| Carry = CombineTrees( 12, Carry ); | 
nz-»TheTrees[ 1 ] = NULL; 
break; 
| case 7: /* All three */ 
i HL->TheTrees[ i ] = Carry; 
Carry = Combinetrees{ Tl, TZ M 
H2-»TheTrees[ i ] = NULL; 
break; 
t 
return Hl; 





图 6-55 合并 两 个 优先 队列 的 俩 在 
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| ElementType 
DeleteMint BinQueue H } 


i 





int i, 33 

int Mintree; /* The tree with the minimum item */ 
BinQueue DeletedQueve; 

Position DeletedTree, OldRoot; 

E'ementType MinItem; 


if( IsEmpty H 2 2 
1 


Error( "Empty binomial queue" ); 
return -Infinity; 


1 


MinItem = Infinity; 
fort i= Q: d < MaxIrees; i++ 1 
{ 
ift H-»TheTrees[ i ] && 
H-»TheTreest i ]-»£lement < Minltem ) 
i 
/* Update minimum */ 
Minitem = H-»ihnejrees; 1 ] ->Element; 
MinTree = i; 
} 
} 


DeletedTree = H-»TheTrees[ MinTree ]; 
OidRoot = DeletedTree; 

DeletedTree = DeletedTree->LeftChild; 
freet OldRoot 3; 


DeletedQueue = Initialize( ); 
DeletedQueue-»CurrentSize = ( 1 << MinTree j - 1; 
for( j = MinTree - 1; j x= 0; je- D 


DeletedOueue-»TheTrees[ j ] = DeletedTree; 
DeletedTree = DeletedTree-»NextSibling; 
DeletedQueue-»TheTrees[ j ]->NextSibling = NULL; 


} 


H->TheTrees[ MinTree ] = NULL; 
H->Current$ize -= DeletedQueue--CurrentSize + 1; 






Merge( H, DeletedQueue ); 
return Minltem; 


图 6-56 一 项 队列 的 DeleteMin 


总 结 


在 这 一 章 , 我 们 已 经 看 到 优先 队列 ADT 的 各 种 实现 方法 和 用 途 。 WHEN RHE HE Bl 
于 箱 单 和 速度 快 从 而 是 精致 的 。 它 不 需要 指针 ， 只 需要 常数 的 附加 空间 ,， 且 有 效 支 持 优先 队 
SABRE 

我 们 考虑 了 另外 的 合并 操作 , 发 展 了 三 种 实现 方法 , 每 种 都 有 其 独到 之 处 。 左 式 堆 古 弟 
归 强 大 力量 的 完美 实例 。 斜 堆 则 是 代表 缺少 平衡 原则 的 一 种 重要 的 数据 结构 。 它 的 分 林 是 有 
gay 我们 将 在 第 11 章 进 行 。 二 项 队列 表明 ,如 何 用 一 个 简单 的 想法 来 达到 好 的 时 间 界 。 

我 们 还 看 到 优先 队列 的 几 个 用 途 , 从 操作 系统 的 工作 调度 到 模拟 。 我 们 将 在 第 7、9 和 10 


章 肯 次 看 到 它们 的 应 用 。 
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练习 


cn 


.1 设 我 们 用 FindMin 替换 DeleteMin BR «SEE Insert 各 操作 FindMin 部 能 以 常数 时 
[P] Sc RS ? 
2 a. 写 出 一 次 一 个 地 将 10, 12, 1. 14.6.5. 8,15, 3,9, 7, 4, 11, 13 02 fi ACRI 
一 个 初始 为 空 的 二 丸 堆 中 的 结果 。 
b. 号 出 使 用 相同 的 输入 通过 线性 时 间 算 法 建立 一 个 二 叉 中 的 靖 来 。 
6.3” 写 出 在 上 向 练习 的 堆 中 执行 3 次 DeleteMin 操作 的 结束 。 
6.4 编写 在 二 叉 堆 中 进行 上 滤 的 例 程 和 进行 下 滤 的 例 程 
.5 写 出 并 测 成 -个 在 二 六 堆 中 执行 Insert, DeleteMin, BuildHeap. FindMin, DecreaseKey, 
Delete 和 IncreaseKey 等 操作 的 程序 。 
.6 在 图 6-13 PARTE A Ro n a? 
7 a. 证 有 明 对 于 - ‘ 叉 堆 ,BuildHeap BY FETCH 2N -~ 2HE. 
b. TEAR 8 个 元 素 的 堆 可 以 道 过 堆 志 素 间 的 8 次 比较 构成 . 
cs 给 出 一 个 算法 ， EN + O(log NTE RHEE .个 一 又 堆 。 
(46.8. 证 明 , 在 一 个 大 的 完全 推 (你 可 以 假设 N = 2* 一 1) 中 第 个 最 小 元 的 期 绷 深 度 以 
log k A. 
Ora. BH PEW — VHP DEEPA X MAPA. 你 的 算法 应 该 以 
OK 8%, Hob, K 是 答 出 的 节点 数 。 
b. 你 的 算法 可 以 扩展 到 本 童 讨论 过 的 任何 其 他 堆 结 网 吗 ? 
we. SMB, 使 最 多 用 大 约 3N IA 次 比较 找 出 二 叉 堆 中 任意 的 项 X 
. .6 10 提出 - .个 算法 ,用 OUM + log N loglogN) 时 间 将 M 个 节点 插 人 刘 六 (GRE. 
HEX, LEW PREETI A. 
6.11 编写 一 个 程序 输入 N 个 元 素 并 
a. HEM PHAR TE. 
b. 以 线性 时 间 建 立 一 个 堆 。 
比较 这 两 个 算法 对 于 已 排序 、 反 序 以 及 隧 机 输入 的 运行 时 间 ， 
6.12 fi DeleteMin 操作 在 最 坏 情 形 下 使 用 2log N UC EERE. 
xa. HEM — BHA 3E TS DeleteMin 操作 只 使 用 log N + logiog N t OC? ial 
的 比较 ,。 这 未 必 意 味 着 较 少 的 数据 移动 。 
cb, 扩展 你 在 (a) 部 分 中 的 方案 使 得 内 执行 log N 1 loglogiog N + OCL) KERR. 
、<¢， 和 你 能 够 把 这 种 想法 推 加 多 还” 
d. 在 比较 中 节省 下 来 的 开销 能 天 补偿 你 的 算法 增加 的 复 菏 性? 
6.13. 如果 - -个 忆 堆 作为 一 个 数组 存储 , 那么 对 位 于 位 置 ; 的 项 ,其 父 亲 和 儿 子 部 在 哪里 ? 
6.14 设 一 个 未 堆 初始 时 有 个 元 素 , 而 我 们 需 监 对 其 执行 M 次 PercolateUp Fl N 次 
DeleteMin. 
a. AMON 和 4 表示 的 所 有 操作 的 总 的 运行 时 间 是 多 少 ? 
b. 如果 d = 2, 所 有 的 堆 操 作 的 运行 时 间 是 多 少 ” 
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6.15 
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6.16 


ae 


c. 如 果 d = O(N), 总 的 运行 时 间 是 多 少 ? 
«d. 对 d 作 什 么 选择 将 最 小 化 总 的 运行 时 间 ? 
最 小 一 最 大 堆 (min-max heap) 是 支持 两 种 操作 DeleteMin 和 DeleteMax 的 数据 结 
H, 每 个 操作 用 时 O(log N)。 该 结构 与 二 叉 堆 相同 , 不 过 ,其 堆 序 性 质 为 : 对 于 
在 偶数 深度 上 的 任意 节点 X, FHE 芒 上 的 关键 字 小 于 它 的 父亲 但 是 大 于 它 的 棚 
父 ( 这 是 有 意义 的 ), 对 于 奇数 深度 上 的 任意 节点 X, FAE X 上 的 关键 字 大 于 它 
的 父亲 但 是 小 于 它 的 祖父 ， 风 图 6-57. 
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图 6-57 最 小 -最 大 堆 


a. 我 们 如 何 找到 最 小 元 和 最 大 元 ? 
«b. 给 出 一 个 算法 将 一 个 新 节点 插入 到 该 最 小 -最 大 堆 中 。 
«c. 给 出 一 个 算法 执行 DeleteMin 和 DeleteMax. 
sd. 你 能 否 以 线性 时 间 建 立 一 个 最 小 一 最 大 堆 ? 
.e， 设 我 们 想 要 支持 操作 DeieteMin、DeleteMax 以 及 Merge. 提出 一 种 数据 结构 以 
时 间 O(log N) 支 持 所 有 的 操作 : 
合并 图 6-58 中 的 两 个 左 式 堆 。 





图 6-58 


写 出 依 序 将 关键 字 1 到 15 插入 一 个 初始 为 空 的 左 式 堆 中 的 结果 。 

证 明 下 述 结论 成 立 或 不 成 立 : 如 果 将 关键 字 1 到 25 . 1 依 序 插入 到 一 个 初始 为 空 
的 去 式 堆 中 , 那么 结果 形成 一 棵 理想 平衡 柄 (perftectiy balanced tree) 。 

给 出 一 个 生成 最 佳 左 式 堆 的 输入 的 例子 。 

a. 左 式 堆 能 否 有 效 地 支持 DecreaseKey? 

b. 完成 该 功能 需要 哪些 塞 化 (如 果 可 能 的 话 )? 
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6.2) MARE —P LU Ai ERD A P,P — x. 
EUE ME HPCE HRN. 24 fT  PFindMin 或 DeleteMin BY. dig UR T 
点 被 删除 则 存 症 -个 洪 在 的 问题 ,因为 此 时 节点 必须 被 实际 删 陈 日 需 要 找到 实际 
的 最 小 元 ,这 可 能 涉及 伸 删 除 其 他 一 些 已 做 标记 的 节点 。 在 该 三 法 由，Delere (ER 
— 4 BG, 但 一 次 DeleteMin 或 FindMin 的 开销 却 依赖 于 被 做 删除 标记 的 等 总 的 
个 数 . 设 在 - -次 DeleteMin 或 FindMin 后 全 标记 的 节点 比 操作 前 少 了 下 个 . 
ea. 说 明 如 何以 OC log N)BJIEHAT DeleteMin. 213 

^o b. 提出 一 种 实现 方法 ,通过 分 析 证 骨 执 行 PeleteMin 的 时 间 为 OC log (N78). »" 

6.22 我 们 可 以 以 线性 时 间 对 左 式 堆 执 行 BuildHeap 操作 :; FP MANES SRA 
OE, 把 所 有 这 些 堆 放 到 一 个 队列 中 之 后 , 让 两 个 堆 出 队 . 人 台 并 它们 , BEREGOUT 
ARAA, 直到 队列 中 只 有 一 个 堆 为 止 - 
a. 证 明 沪 算法 在 最 二 情形 下 为 O(N)。 
b. 为 什么 该 算法 优 于 课文 中 描述 的 算法 ? 

6.23 合并 图 6-58 PRI BUE. 

6.24 写 出 将 关键 字 1 到 15 KARAS REN IIHR, 

6.25 证明 下 述 结论 成 立 或 不 成 立 : 如 果 将 关键 字 1 到 2* -- 1 RABI Pin i ts 
的 射 堆 中 , 那么 结果 形成 -…- 棵 理想 平衡 树 (perfectly balanced tree). 

6.26 ”使 用 标准 的 二 叉 堆 算法 可 以 建立 一 个 N PCR MRE. 我 们 能 理 将 练 半 6.22 中 
描述 的 同样 的 人 台 并 方法 用 于 斜 堆 而 得 到 O (NOS TTHTIB]? 

6.27 证明 二 项 树 B, ELLE BS, Bi oo’ Be PEARLY. 


. Å anon 
6.28 证 明 高 度 为 上 的 一 项 树 在 深度 过 有 | NS 
6.29 将 图 6-59 出 的 两 个 一 项 队列 合并 ， 
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6.30 a. TEAR: 向 初始 为 空 的 二 项 队列 进行 N 次 Insert 最 坏 情 形 下 的 运行 时 间 为 


O(N); 
1， 给 出 一 个 算法 来 建立 有 N AUCH MORO, 在 泡 素 问 最 多 使 用 六 1 次 比 
9 


«c. IB CERE, AOM + log N 最 坏 情形 运行 时 间 将 M 个 节点 插入 到 NN 个 
元 内 的 二 项 队列 中 ; uEBRÁRES E. 
6.31 写 出 一 个 有 效 的 例 程 使 用 二 项 队列 来 完成 Insert PRAE, 不 要 调用 Merge. 
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6.32 SFA: 
a， 当 调用 Merge(H, HORE EAE E A o 修改 代码 以 修正 该 问题 。 
b. 如 果 在 FI; PRA WA PA Carry 树 为 NULL, ER Merge 鲍 程 以 终止 合并 。 
c. 修改 Merge 使 得 较 小 的 树 总 被 合并 到 较 大 的 树 中 。 
«*6.33 假设 我 们 将 二 项 队列 扩充 为 允许 每 个 结构 至 多 有 两 棵 相同 高 度 的 树 - 我 们 能 否 在 
其 他 操作 保留 为 O(log NN) 时 实现 最 坏人 情形 时 间 为 OCT) BUTEA? 
6.34 设 有 许多 盒子 , 每 个 盒子 都 能 容纳 总 重量 CHI i, iz igs e iy, 它们 分 别 
Bow), we, wa, sss Who 现在 想 要 把 所 有 的 物品 包装 起 来 , 但 任 一 盒子 部 不 能 
放置 超过 其 容量 的 重 物 ， 而 且 要 使 用 尽量 少 的 合子。 例如, 若 C = 5, 物品 分 别 重 
2, 2, 3, 3, 则 我 们 可 用 两 个 盒子 解决 该 问题 。 
一 般 说 来 , 这 个 问题 很 难 , 没有 已 知 的 有 效 的 解决 方法 。 编 写 一 个 程序 , 有 效 
地 实现 下 列 各 近似 策 赂 : 
ra. 将 物品 放 人 能 够 承受 其 重量 的 第 一 个 盒子 内 (如 果 没 有 盒子 拥有 足 人 驶 的 容量 网 
开辟 一 个 新 的 合子)。( 该 策略 以 及 后 而 所 有 的 策略 都 将 得 出 3 个 盒子 , 这 不 是 
最 优 的 结果 。 ) 
b. 把 物品 放 人 对 其 有 最 大 容量 的 盒子 内 。 
«c. 把 物品 放 入 能 够 容纳 下 它 而 又 不 过 载 的 装填 得 最 满 的 盒子 中 。 
«xd. 这 些 策 上 略 中 有 通过 将 物品 按 重 量 预先 排序 而 功能 得 到 增强 的 吗 ? 
6.35 BRIER KHE DecreaseAllKeys(A) 添 加 到 堆 的 指令 系统 中 去 。 该 操作 的 结果 是 
” 堆 中 所 有 的 关键 字 都 将 它们 的 值 减少 量 A。 对 于 你 所 选择 的 堆 的 实现 方法 , 解释 所 
做 的 必要 的 收 改 , 使 得 所 有 其 他 操作 都 保持 它们 的 运行 时 间 而 DecreaseAllKeys 以 
O{ 所 运行 。 
6.36 ”这 两 个 选择 算法 中 哪个 具有 里 好 的 时 间 界 ? 
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7:9 HR 序 


这 一 FRAP AEE CRR e AT CO EPR PA BB RH 
Mii eR AE. HOA ES eZ Ag ae PA RD ERY) | RPA RAPA A, 我 们 还 假设 莹 个 
HHY ARES fe ETE SER. 因此 , oo BY RO ee heheh po^) PSR, 不 能 在 主 
PER ERE A v CE TA SL ake Eear bg BRR Ge EA HE APh A ea pvp AE ox- 
terval sorting } DEC pu «i AFE i iTe. 

Ae (De SEHR IPIE ARE 

e diie ILERA E HIERE OCNTMREIT , UHA AGE 

e (1 RR B Ar HET CShellsort) . t 5fe3E' 简单， Pl ol naig., HAER PE 

SES 

e {p---e RE ORE SEE OCN dog NOBSHHE HRS IE. 

e iT fs FAY BERR LEE GUN log NUR ELA 

1S HARB HG ZETA HEAL: 这 些 算法 包含 一 些 有 趣 的 和 重要 的 代码 优 
化 和 多 法 设计 思想 ”可 以 对 排序 做 出 精确 的 分 析 ， 孤 先 说 明 ， TE MAIE. RIIT fe 
ii Erg eor. 


7.1 预备 知识 


fes GARR AY BGR ay ETAT. PTL HE PA CRY TX 
IER CC EE 

FRIE N GEER AEE BUR HCE POR. Ec eee, AGAIN. Fe 
HEC Age ae ott PTA RAE. Xf AEE ELO 处 开始 

Tec <A > ui ERES. 它们 可 以 用 于 将 相 容 的 序 放 人 到 输入 中 ， 除 赋值 运算 
符 外 ， 这 两 种 运算 是 公有 的 允许 对 输入 数据 进行 的 操作 。 在 这 些 茶 件 下 的 排序 叫 德 基于 化 园 


VPE C miparison- hased sorting). 


7.2 插入 排序 


7.2.1 算法 

报 阶 单 的 排序 算法 之 一 第 插入 排序 finsertion sort) - 所 入 排序 由 NC d 3S Cpass) HF IL 
WoO EP DESI P N- 1 未 ,插入 排序 保证 从 位 置 0 BUG PoC A PAS. 
多 六 排 洗 利用 了 这 样 的 事实 : 位 置 6 到 位 置 P- 1 LAR RELI. 图 7-1 显示 一 个 
ft np ME -iih A EFE HIS UR - 

5 7.] &Kik T--RRBg2;15 ER P BA, NA^ HE P RACHA Baa (ERT P-IT^ 
pu" Ho RT 中 的 程序 实现 该 想法 : 532 行 到 第 5 T ELCHE EE m c ERU] E 
Whee. CORP EMDURIT Tap. MEME 三 之 前 ) 所 有 更 大 的 元 素 都 被 向 右 移动 (T 
(ch ORG Dap 被 置 二 正确 的 位 置 上 上- 这 种 方法 HEA 7 X WERE ET H1 BTE 25 Fifa] - 
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] 
i} 
1 
3 
4 
7-1 每 不 后 的 搬入 排 序 
Po a S] 
| void 
| InsertionSort( ElementType AL ], int N 3 
| int 1, P; 
Element Type Tmp; 
ft 1s for( P = 1; P « N; Pe 3 
| 
fe 2*/ Tmp = AT P 4; 
/* 3*/ forl j= P; j > 0 && AL j - 11 > Tmp; j-- 5 
f* 4*/ A[ j J] = ALJ - 1); 
| f* 55) AL } ] = imn; 


图 72 AHT RE 





7.2.2 插入 排序 的 分 析 

出 于 报 套 循环 的 每 一 个 都 花费 N 次 送 代 , 因此 插入 排序 为 O(N?). 而 旦 这 个 办 是 精确 
的 ,因为 以 反 序 输入 订 以 达到 该 界 。 精确 计算 指出 对 于 了 的 每 个 值 , 第 4 行 的 测试 最 多 执 
P+R. SHB PRA, 得 到 总 数 为 


Ni =24+31+4+...4N = OCN?) 
男 ai, 如 果 给 入 数据 已 预先 排序 , 那么 运行 时 间 为 ON). 因为 内 层 for BEES EMI 
是 立即 判定 不 成 立 而 终止 。 事 实 上 ， 如 果 输 人 几乎 镍 排序 (该 术语 将 在 下 一 节 更 产 格 地 定义 )， 
堵 么 插 人 排序 将 运行 得 很 快 。 由 于 这 种 变化 差别 很 大 ,因此 值得 我 们 去 分 析 该 算法 平均 情形 的 
行为 。 实 际 上 , 和 各 种 其 他 排序 算法 一 样 , 插 人 排序 的 平均 情形 也 是 GUN, 详 见 下 节 的 分 析 。 


7.3 ”一些 简单 排序 算法 的 下 始 


成 员 存 数 的 数组 的 . -个 道 序 (inversion) 是 指数 组 中 其 有 性 质 i<7 BAL] > 站 | 站 的 序 
BOCA], AL Ds TEE HABIT B. 输入 数据 34, 8, 64, 51, 32, 21 有 9 个 道 序 ， 节 (34， 
8). (34, 32), (34, 21), (64, 51), (64, 32), (64, 21), (51, 32), (51, 21) 以 及 (32, 21). 
prt. 这 正好 是 需要 由 插 人 排序 ( 非 直接 ) 执 行 的 交换 次 数 . 情况 总 是 这 样 ， 因为 交换 其 个 不 
控 闵 序 排 询 的 相 邻 元 素 欠 好 消 除 一 个 逆序 ， 而 一 个 大 过 序 的 数组 没有 北 序 。 由 于 算法 中 还 有 
OCN BUR BR TAE, 因此 插 人 排序 的 运行 时 间 是 OC +N), 其 中 了 为 原始 数组 中 的 逆序 
数 ， 于 是 , 若 道 序数 是 ON), 则 插入 排序 以 线性 时 间 运 行 。 

我 们 可 以 通过 计算 排列 中 的 平均 泛 序 数 而 得 出 搬入 排序 平均 运行 时 间 的 精确 的 乔 、 tt 
常 一 样 , 定义 平均 是 一 个 困难 的 命题 。 我 们 将 假设 不 存在 重复 元 素 ( 和 如 果 我 们 允许 重复 ， 那 
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反目 全 连 量 贫 的 平均 次 数 究 竟 是 什么 都 不 清楚 ) AAR. 我 们 可 设 输入 数据 是 帅 N T 
整 效 的 车 个 直列 (因为 只 在 相对 顺 施 才 生 重 对 的 ). 并 设 所 有 的 排列 邦 是 等 可 能 的 ”在 这 些 假 
这 下、 我 们 有 如 下 定理 : 


定理 7. 
N 个 下 异 数 的 数组 的 平均 逆序 数 是 NAN - DAL. 
证 明 : 


Mt PLR L. PERF LEP Ay ab 21. 42.51, 64. 8,34 # 
iA ALE RRA 0. Hv > 显然 , EEL AIL, SH -0 BEER 
— Site ER L B'EBISCHEAXL, OPW PRA NON -1)° 2 Blut. PI RAR 
n9 of, BINEN — DA T XI 

XP FE ACHE EEE TRA. Te te EA ee oe RE EU - 
TREAD T FF 


定理 7.2 
通过 交换 相 邻 匹 素 进行 排序 的 任 柯 算法 平均 需 归 只 CN) 时间 
WEAF : 


WARREN EET NON - DA = MN). 而 等 次 交换 只 减少 一 个 逆序 . 因此 需要 
O(N" RRB 

这 是 计 明 下 办 的 - -个 例子 , E TII EEA Ra EC REGERE SCC e I) S6 TR Bddr ACHE 17 a. 而 
Hou i ARE BE BTR E TAE TE f — 1€ fay "PORE AE th RB CO. DEER PEI IT AS pax 
BE. SCE, 它 对 一 整 类 只 进行 相 邻 元 素 的 交换 的 排 厅 算法 . tLe SEES RO 
ih. RARE UM CN Ago. 这 个 证 明太 经 验 上 是 不 能 被 认可 的 BAR P S BGuEMR E 
党 简单 . 但 是 ARE HHP ARSE LT pL AA E. 

这 个 下 界 告 沂 我 们 ， 为 了 使 一 个 排 厅 算 法 以 业 — IX Csubquadratic) Bk of No falie dr, on 
须 拟 行 - PELE AE. 特别 昌 对 相 另 绞 远 的 元 来 进行 交 反 一 个 排 字 算法 通过 删除 道 序 得 以 向 前 
进行 ,而 为 了 了 有效 地 运行 , 它 区 须 每 深交 换 删 陈 不 止 一 个 逆序 - 


7.4 项 尔 排序 


ABE, hellsort MP BOLE A ALAA A Donald Shell . PASE A LE aR RT ded e 
的 第 一 批 算 法 之 -. 不 过 , 和 白 从 它 最 初 被 发 现 . XGIY A MFS TU P Y OBI 
zn LE MERAY. 它 道 过 比较 相距 -守则 隔 的 元 未 来 工作 ; 6e ELLERPEPTHT UOTE ERA RC I 
航 进 行 而 减 小 , EDAD E BSc is AHT k. 由 于 这 个 诛 内 ， 和 水 排 厅 有 只 也 
ni (ibe ag o] RE HE A diminishing increment sort) 

ERHET- PPS Aq. Ao, oo. A, IRGI APF] (increment sequence) WISE A= Litt 
(pm EF SARE Uap AD. 不过, redd EL bg El RIR EA 
个 问题 )， 在 合用 增 基 a 的 一 趟 排序 之 后 ， 对 于 每 -- 个 我 们 有 和 iba Aio A, GRE 
ey Lm 所 有 相隔 as 的 元 素 邦 被 排序 HE RR XC E Ar HEAR CAS sone INT. UE ru 
T3 ATER SEE Ba L. ARAFA A RREA] Aa PA) Ee c 
^ n ARE GS SOE OR E EHE A, HET REO PY EAD 让 排序 性 .事实 下, fattii t Het FF 


ty 
rt 


的 证 、 脏 么 该 算法 也 就 没什么 意 久 了， 因为 将 向 各 峭 排 序 的 线 打 就 会 被 语 而 各 档 排 于 





| 
e| 


"aul 








| 在 | MOOD gp 28 12 41 %5 15 94 38 8l 94 95 V 
| 4 和 -排序 后 ， n 12 tl 35 18 41 SB 17 44 73 81 96 33 | 
在 1- 排 序 后 12 15 id^ 28 35 41 Sh 735 HT 94 95 46 





图 7-3 RHET REEL FS S PO 


-排序 的 一 般 做 车 是 , HT h hi td... NOL PRP. 把 其 上 的 元 素 放 
到 7 一 各 ,2 中间 的 正确 位 置 上 : 虽然 这 并 不 影响 最 终 续 CR. Hae th ne E 

—& A, 一 排序 的 作用 就 是 对 A, Tür A TARRI — RAHET. SSSR at a A as 
序 的 运行 时 闻 时 , AORAR EIR SEIS. 

增 量 序列 的 一 种 流行 (但 是 不 好 ) 的 选择 是 使 用 Shell 建议 的 序列 : A, 7| NY 2 IATA, = 
Lanai? 21H 7-4 er —^ fe RAI RM RY. J RAT BP FAE cum 
增 的 序列 , EVD ABA ot RT SEE BOE; 即便 是 一 个 小 的 改变 剧本 能 剧烈 好 
影 吓 着 算法 的 性 能 ( 见 练 习 7. 10). 

图 7-4 中 的 程序 以 与 我 们 在 播 和 人 排序 实现 方法 中 相同 的 方式 避免 明显 地 使 用 交换: 





void 
Shellsertt ElementType AL J. int N } 
int i, J, Increment; 
ElamentType Imp; 
A le fort Increment = N / 2; Increment > 0; Increment /= 2 } 


ft a for( i = Increment; à < M; ie } 
| | 
| f= 3*/ Tmp = AE d j: 
f[* 4*5j fort j = 4; j >= Increment; j -- Increment + 
fe nj if( Tmp < A( 7 - Increment ] ) 
/* o*r AL 3 ] =A j - Increment 1; 


I 


MEN i 


Pel 7-4 GRR ABESSE DE CIEE GERARD 


7.4.1 希 尔 排序 的 最 坏 情形 分 桥 

TRARRE, 但 是 ,其 运行 时 间 的 分 析 则 完全 是 另外 一 回 事 . Ar ASHE IY Bux 
yest (eae Fe RAEE, E WEN AT HE A TERES 希 尔 排序 的 平均 情形 分 析 . BR ROP TU 
的 一 些 增 量 序 列 外 , 是 一 个 长 期 未 解决 的 问题 . 我 们 将 证 明 在 两 个 特别 的 增 晤 序列 下 最 坏 悄 


TE Imp me m As 
定理 7.3 
使用 希 尔 增 量 时 希 尔 排 序 的 最 坏 情形 运行 时 间 为 Bt Nv). 
iE AA : 


HEA) ALA 8 UE JB T REPRE a ij AEM TER PAR EME 
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一 一 一 — — — 1a -一 - 一 


HOON NSIT. 首先 通过 构造 :个 坏 情 霹 来 证 明 下 界 、 我 们 先 选择 N RR BO. 这 使 
得 除 最 后 NER d 外 所 人 的 增 量 部 是 倘 数 .现在 ,我们 给 出 一 个 数组 InpurDanta 作为 输 
A. COR ES N/A2 个 问 是 最 大 的 数 , 而 在 奇 数位 置 上 有 NA2 个 同 为 最 小 的 数 ( 对 
EO, 第 一 个 位 置 是 位 置 门 ， 由 于 除 最 后 一 个 增 量 外 所 有 的 增 些 部 是 偶数 ,因此 ， 当 我 们 
进行 最 后 -… 趟 排序 前 ,NA 2 个 最 天 的 元 素 仍 然 处 在 偶数 售 置 上 , 而 N7 2 个 最 小 的 无 素 也 还 
BERRIE R. 于是、 在 最 后 一 趟 排序 开始 之 前 第 ; 个 最 小 的 数 {i 所 N/A2) 在 位 轩 2i- 1 
LO 将 第 个 元素 属 复 到 此 让 确 位 是 党 要 在 数组 中 移动 : -1 个 间隔 。 这样 , 仅 仪 将 NY 2 
个 最 小 的 元 素 放 到 正确 的 位 置 上 就 需要 至 少 > 7 一 1 = QUND 的 工作 ， 作 为 一 个 例子 ， 
I] 7-5 los :个 =16 时 的 故 ( 但 不 足 最 直 ) 的 输入 在 2- 排序 后 的 逆序 数 一 于 怡 好 保持 为 
1-243-4-5:1647-—28; 因此 , 最 后 一 趟 排序 将 花费 相当 多 的 时 间 ， 

现在 我 们 证 明 上 界 OK N2) 以 结束 本 证 明 、 前 而 已 经 观察 到 , 带 有 增 量 入 的 一 趟 排序 由 
hy TEFEN 个 元 素 的 搬入 排序 组 成 ， 由 于 插入 排序 是 二 次 的 ,因此 一 目 排 序 总 的 片 销 奉 


OAN aP) = OUNT hg) 对 所 有 各 趟 排序 求 和 则 给 出 总 的 界 为 OC NS UNT) - 
OCNT 、 IZh) 内 为 这 些 增 量 形成 一 个 几何 级 数 , 其 公 比 为 2, 而 该 级 数 中 的 最 太 项 二 
k =. A, NO 7h, « 2. 于是. 我 们 得 到 总 的 界 ON’). 












FTU ——— s 

1 FË | 19 2 10 3 11 à 5 8 

| 在 8 排序 后 | 1 3 7 10 3 11 4 12? 35 t 4 

| 在 二 排序 站 1 1 9 2 00 3 0 4 92 5 143 8 le | 
在 1 排序 后 | 1 9 2 0 3 11 4 12 3 13 G 14 7 15 $8 16 | 
| 1 2 3 4 5 å 7 > FO 11 142 14 J4 15 lé | 





在 EHE 





图 7-5 有 具有 项 尔 增 昌 的 希 尔 排 序 的 坏 情 形 ( 位 置 编号 从 1 到 16) 


希 尔 增 量 的 问题 在 于 , 这些 增 量 对 未 必 互 素 , 因此 较 小 的 增 基 可 能 影 啊 很 小 Hibbard 
pip —4 Rm pm aod E EE. 它 在 实践 中 (并 日 理论 上 ) 给 出 更 好 的 结束 :他 的 增 世 形 如 | 
3.7... 22- 1 虽然 这 些 增 量 几乎 号 相同 的 , 但 关键 的 区 别 是 相 邻 的 增 量 没有 公 因 于 : 
其 在 我 们 号 来 分 析 使 用 这 个 增 基 序列 的 希 尔 排 序 的 最 坏 情 形 和 运行 时 间 , 这 个 证 明 相 当 复 水 ， 

定理 7.4 

使 用 Hibbard 增 量 的 希 尔 排序 的 最 坏 情 形 运 行 时 间 为 ON? 7). 

证 明 : 

我 们 HEB EH mH F FB ur BH 留 必 练习 ， ix “PE BH ae SEHE “A iE ( additive number the- 
ory) HIER TAS. ARERR T. Ea RBS SA 

lay hi. GE. AFEA, FRET RA AE 3s TTT PA FE ERROR A, 
qaae Ay > N! :的 增 基 , 我 们 将 使 用 前 -~ 定 肆 得 到 的 界 O(N Zh.) 号 然 这 个 办 对 于 其 他 
增 量 也 是 成 立 的 . 但是 它 太 大 , HTL. EWEA. 我 们 必须 利用 这 个 增 量 序列 是 特殊 的 这 
样 -个 午 实 ”我 们 需要 证 明 的 是 ,对 于 位 置 P 上 的 任意 抑 素 Ap. SEAT hi BERE, LUT 
>t GE GER P WZ AT Ap- 

要 对 输 人 数组 进行 Ap 排序 时 , 我 们 知道 它 已 经 息 hp, HEZA ea HET TE Ae 
HELL. SER PAP- i LARDER, HB IP. WIR i Thap. IE A AYRIK, Hi 


170 #7 
么 显然 A[P - i| « ALP]. 不 仪 如 此 ， MR TWA, AA, REAR G CL dE f d 
数 的 上 形式}, 那么 也 有 ALP iix APIS Bj, SREE 3- REPEAT, X PEU ERE 7-3] 
序 和 15- 排序 的 了 52]ELE A 7 ALIS 的 线性 组 合 : 52 = 1X7 + 3x15. FA, A110014 
可 能 大 于 A'152], AA A[T00; LAT E07 ISA] 221 A [137 17 A [ 152]. 

dé. his; 72h, "E l, 因此 h, Al hing SC A SEN. TEX 文 种 情形 下 ， 可 以 证 明 , 至 少 
HOi DO (hy 37-1) EBA + 4; 一样 大 的 所 有 整数 都 可 以 表 为 和-.: 的 线性 组 合 
{ 见 本 章 末 尾 的 参考 文献 ),， 

这 就 告诉 我 们 , 第 4 行 的 for HEPAT EN - A, 位 置 上 的 告 “个 .最 多 执行 8h + 4 
=OCA ) 深 。 于 是 我 们 得 刘 每 霄 的 宰 O Nh) a 

利用 大 约 一 半 的 增 晨 满 足 中 < 过 v 只 的 事实 并 假设 上 是 偶数 ,那么 总 的 运行 时 间 为 

O( 3M, + SN NU) = ONS ha tN Yu ha) 


点 一 上 + bl 


内 为 两 个 和 都 是 几何 级 数 ， HH 4,5; = OCW N), 所 以 上 式 简 化 为 


= O(Nh, 5^) + olg |= OCGN??) 


使 用 Hibbard FER BOE RHEE As frm T8] Ade TRU RA O (N77), 4i 
是 没有 人 人 能够 证 明 该 结果 。Pratt 已 经 证 明 , OCNCCO BS GERITI UZ ey 

Sedgewick 提出 了 几 种 增 景 序列 ,其 最 坏 情形 运行 时 间 ( 也 是 可 以 达到 的 ) 为 OCN S). 
对 和 于 这 些 增 量 序列 的 平均 运行 时 间 猜 测 为 OCNT )。 经 验 研 客 指出， fee 人 
行 要 比 Hibbard 的 好 得 多 , 其 中 最 好 的 是 序列 11.S,， 19, 41，109 , 该 序列 中 的 项 或 者 是 
Qep e Get 1, 或 者 是 于 一 3: 22 t 1, 通过 将 这 些 值 放 到 一 oath OT LBS B 
HU. KRATERY ETEA AN REIR RE AST e IRE i CT LYS oi o 
it, 但 是 , 这 个 增 量 在 实践 中 还 是 最 为 人 们 称道 的 . 

关于 希 尔 排序 还 有 几 个 其 他 结果 , 它们 需要 数论 和 组 合 数学 中 一 些 艰 深 的 定理 而 匡 主 要 
是 在 至 论 上 有 用 。 希 尔 排序 是 算法 非常 简单 旦 又 具有 极其 复杂 的 分 析 的 一 个 好 例子 : 

项 水 排序 的 性 能 在 实践 中 是 完全 可 以 接受 的 , 即使 是 对 于 数 以 万 计 的 N 仍 是 如 此 : 编 
程 的 简单 特点 使 得 它 成 为 对 适度 地 大 量 的 输入 数据 经 常 选用 的 算法 : 


7.5 HEHE 


如 第 o Siae, PRACT] RAHA ESTE OCN log NET AS BERR. 基于 该 想法 的 算 
法 叫做 玲 排 序 {heapsorD 并 给 出 我 们 至 今 所 网 到 的 最 佳 的 大 O 运行 时 间 。 然 而 , 在 实践 中 它 
HEB FE FA Sedgewick 增 量 序列 的 希 涉 排序 ， 

回忆 在 第 6 章 建立 N 个 元 素 的 二 叉 堆 的 基本 上 方法， 此 时 的 花费 是 DCN) 时 间 。 然后 我 

们 执行 N 次 DeleteMin 操作 。 按 照 顺 序 ， 最 小 的 元 素 先 离开 该 堆 . 通过 将 这 些 元 素 记 录 到 第 
二 个 数组 然后 再 将 数组 找 员 间 来 ， N 个 元 素 的 排序 ,， 由 于 每 个 DeleteMin 化 费时 间 
O(log N), 因此 B gie B AS O(N log N). 

该 算法 的 主要 问题 在 于 它 使 用 IR a BAL. 因此 ,存储 需求 增加 - : 倍 。 在 基 些 搓 
后 中 这 吉 能 是 个 问题 注意, 将 第 二 个 数组 拷贝 辐 第 一 T ER 85 ga 5H nf B RE ELE ON). 
这 不 可 能 显著 影响 运行 时 间 -。 这 个 问题 是 空间 的 问题 : 


避免 合用 第 二 个 数组 的 陪 明 的 做 法 是 利用 这 样 的 事实 ; 在 每 次 Deletevin <a, ALAR) 

I. Pte, 个 于 堆 中 最 后 的 单 苞 可 以 用 来 存放 刚刚 册 去 的 无 素 例如、 度 我 们 有 一 个 进 ， 
它 售 有 六 个 元 素 第 一 次 DeleteMin 产生 个 A, 现在 该 玲 只 在 开 个 元 素 , 因此 我 们 可 以 把 
A, REPL 6 FE. FI DeleteMin nH: T A». H FERHERBUTE HB VQ PoCR. | 轩 此 我 们 把 
As. etu 5 b 

使 用 这 种 策略 ,在 最 后 一 次 DeleteMin fi, PARUALRE LA GB WERT GL bR 如 未 
我 们 相机 这些 元 素 排 成 更 典型 的 递增 顺序 ， 财 么 我 们 训 以 改变 序 的 特 任 使 得 父亲 的 关键 宁 的 “328 
但 大 十 儿子 的 关键 字 的 值 ” 这 样 城 得 到 {max) 截 

A A UER E ERII ADT EIMA HSA 
Th. 得 一 件 事 者 是 在 数组 中 完成 的 . RAP REHE E — ME. AE N rr 
RR FEI. ORY ET Fa IRE N 1 Date “GH. 
Shit, BELA RRR Wy fo Ske ae. 例如 , SUA FPR 31, 41, 59. 26. 53 
SR. 97. 所 得 到 的 堆 如 图 7-6 也 小: 





图 7.6 7E BuilldMeap 阶段 以 二 的 (Ar HE 


BL 7.7 显示 在 第 一 次 DeleteMax 之 后 的 堆 ， 从 图 小 看 出 , HF milo wow 31; HERA 
rh pg ST 的 那 一 部 分 从 技术 上 说 已 不 再 属于 该 堆 . 在 此 后 的 5 次 DeleteMax 操作 之 后 , AHE 
实际 上 只 在 一 个 元 素 , AERA PRC RSA AS TS AT 
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图 7-7 在 第 一 次 DeleieMax IG HE - -一 


执行 卉 排序 的 代码 在 图 7-8 中 给 出 : 稍微 复杂 的 征 ， Me CX HE, CEU E EUH F 


“ha 


um 


标 1 处 开始 , 而 此 处 堆 排 序 的 数组 包 洛 舍 置 4 处 的 数据 :. 因此 , EP Te aS 
有 些 不 同 , 不 过 变化 很 小 ， 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 
define LeftChild€ id (2 7312 91» 
void 
PercDownt Elementlype AL J, int i, nt H 5 
1 


Tnt Child; 
ElementType Tmp; 


/8 lt fort Tmp = AL i J; Leftthiid( 1 J = N; = Child 3 
: 
f* orf Child = LeftChiTd( i); 
A 37/ if€ Child t= N - 1 & AL Child +27 > Al Child j 3 
f* 44/ Chi ld++; 
IF By Al i ] = AL Child J: 
fr FAF break 
i 
f* Be AL i 5 = Tmp 
} 
void 


Heapsort( ElementType AT ], int N} 


| 
je Shy ifC Tmp < Af Child ] ) | 


int i; 
/* Uf for( 4 =N f 2; 1 »- 0; i-- 5 /* BuildHeap */ 
EP LE PercrDown( A, i, No: 
A ge/ fort i = N - 1; i+ 0; i-- } 

{ 
ft 45/ Swap( &A[ O J, SAL i ] 3; /* DeleteMax */ 
fe 5*7 PercDown( A, 0, i 3; 


| } 
| a o ġo 


图 7-8 MEHET 





7.5.1 堆 排 序 的 分 析 

我 们 在 第 6 章 看 到 ， 第 一 阶段 构建 堆 最 多 用 到 2N 次 比较 。 在 第 二 阶段 , 第 i 次 
DeleteMax 最 多 用 到 Llogi 次 比较 ,总 数 最 多 为 2N log N 一 O (NYKER GZ N22). A 
jk. 在 最 坏 的 情形 下 , 堆 排 序 最 多 使 用 2N log N- O(N) 次 比较 。 练习 7.12tb}) 让 你 证 明 对 
于 所 有 的 DeleteMax 操作 ,有 可 能 同时 达到 它们 的 最 十 情形 ， 

经 验 指出 , 堆 排序 是 一 个 非常 稳定 的 算法 : COEPI EH BRL ERR 比 最 坏 情 形 愉 指出 的 略 
少 。 然 而 直到 最 近 ， 还 没有 人 能 够 指出 堆 排序 平均 运行 时 间 的 非 平凡 朋 ， 似乎 问题 在 于 连续 
的 DeleteMax 操作 破坏 了 玲 的 随机 性 ， 使 得 松 率 论证 非常 复杂 ;最近 ， 另 一 种 处 理 方 法 被 让 


ERO. 

定理 7.5 

Xx ON SL FESTUS RL PL HES ETT HEHE ME. 所 用 的 比较 平均 次 数 为 2N log N- OCN log 
log N). 

ur RA: 


Fg E MERO Em PELE ONARE. 四 此 我 们 只 需要 让 明 第 一 阶段 的 界 。 设 一 个 排列 
Bll, 2, ..., Nie 


te X = 


Mo IA DelewMax HARIA M FHES d, Lio HEAD TERE 24 lee. WTSIA 


jg; A BRTH. E- FTE SU eost sequence LD: af), do. ili. ey "EE JF 8L. 


阶 自 的 开销 该 开销 由 Mp = NTC a, 给 出 ; 关 此 所 使 用 的 比较 次 数 是 2 My, 
全 PON AN Dip TX OPP CRAP 7.322. FOND > (Nage, T e = 
2.74828. . FRR WEA SLA EHE ER Ee E fe eb ad CPP a et NAG 的 开销 小 于 
i - Milog N - log log N — 4), SHEHIRI HH., Mp BS TFEHB GE EM ne 3: 
SOA CGORT- TW, 这 样 ， 比 较 的 平均 次 要 至 少 是 2M 因此, 我们 的 基本 目标 网 是 证 明 存 
asi SBOE EB RY aE 
"RD Zl de E425 452. 所 以 机 于 任意 的 二. 存在 根 元 来 可 能 到 法 的 27 al Be 


TELA ， 对 任意 的 序列 站 .对 应 DeleieMax P] à Ae RF PU TRES E a 
Say = 2" 04s . BUE 
fi n CR DFE HL. a- eG EAE: 
5,728. 


[E Arf d d, OTR 1 A og N_ 之 间 的 任 一 和 什 ,所 出 最 多 存在 (og N)^ 个 可能 的 序列 说. 
resp ay, 5S SREP SE YE M B3 B. Se DeleteMax FRAUD Me OT OA MD IP 
rely ay T Be HEL BEES bk FE FO) DeleteMax 订 列 的 个 数 RAE A v AT 388 ing 
N )* 2M 

AUP ae M ELS ee A 

M-g 
Nog NOX < Gog NY2" 
,一 上 

类 于 我 们 选择 M= N (og N 一 log log N - 4). ASA HRS) FM BHT T GR 
KON ALO)’. S. dE IBIWTERPEME, REUE. 

M RIS E Ap. 可 以 证 明 , HERBERT EERIE N log N 一 OCNDIXIERZ, i ff 
fim ARTE BEP A Rx T S. MANI E HAE IN log N- O(N) Wk owe \“ 是 定 
由 7 了 .5s 中 下 线性 化 的 第 二 项 ); xxdé AR REALS TERA (GE SS Reg aR aE PA AB TIA 


7.6 归并 排序 
现在 我 们 把 注意 力 转 到 上 归 并 排序 (mergewort】 归并 排 厅 以 站 人 log NO we Dh RE rE 1 ry 
melt. Ii BE ERI EBS ET Ye te LTE tz Hoi TTL - TAR ETS D 
4 erp dte pute iE ie SE PS UIE RAY e. PIX PN 个 表 是 已 排序 的 . 所 以 在 将 答 
H — :个 表 中 叶山 该 算法 可 以 通过 对 输入 数据 一 趟 排序 来 完成 ” 基 相 的 合并 算法 是 权时 
个 输入 数组 A ROB. 一 个 输出 数组 C, A 一 个 计数 器 Apir. Borr., Cpr. CAE IRSE tx 


Ly AL PF Rw- A Apir Al BL Bptr | 中 的 较 小 者 被 找 疮 加 中 的 下 一 个 位 置 ， 相关 的 计 
效 器 向 前 推进 一 步 “ 当 两 个 输入 才 有 一 个 用 完 的 时 个. 则 将 另 -个 表 中 剩余 部 分 拷贝 到 


BRE LA OIF WP A R. 
[TT Tt 


REED ps] [rie wj | | 


Apir Bptr (ptr 


APEX A BUS 1.13. 24, 26, 数组 B3 42, 15, 27, 38. MARK RIAU I P: B 
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先 , 比较 在 1 和 2 之 间 进 行 . 1 被 加 到 人 中, 然后 13 $02 进行 比较 。 


Aptr Bpte Cptr 


2 被 添加 到 CC 中, 然后 13 15 进行 比较 。 


CEES) GSE) GREET 
i f 


Aptr Bptr Cprr 


230 13 被 添加 到 Co, 接 下 来 比较 24 和 15, 这 样 一 自 进行 到 26 R8 27 进行 比较 。 


GEE GE) TT LI 
ce) GREET 


Aptr Bptr Cpir 
n [spas Gr TI. 
Aptr Bpir Cptr 
Aptr Bptr Cptr 


将 26 Ws bs C rp, 数组 A 已 经 用 完 。 


elses) Geer 
T 1 


Aptr Bptr Cptr 
将 数组 BARES VLSU C 中 。 


| | 7|38| s12a 26 | 271 38 
|j [24|26] |2 15 | 27| 38 13 | 15 | 24] 26 | | 


Apr Bptr Cpt 


合并 两 个 已 排序 的 表 的 时 间 显 然 十 线性 的 ， 因 为 最 多 进行 了 N 一 1 次 比较 , 其 中 N XUL 
素 的 总 数 。 为 了 看 清 这 一 点 . 注意 每 次 比较 都 是 把 -个 元 素 加 到 C 中 , 但 最 后 的 比较 除外 ， 
它 至 少 添加 两 个 元 素 。 

mb. 归并 排序 算法 很 容易 描述 。 如 果 N = 1. 那么 只 有 一 个 元 素 需 要 排序 , BRER 
然 的 。 否 则 , 违 归 地 将 前 半 部 分 数据 利 后 半 部 分 数据 各 自 归并 排序 ， 得 到 排序 后 的 两 部 分 数 
据 , 然后 使 用 上 面 描述 的 合并 算法 再 将 这 两 部 分 合并 到 一 起 例如 . SUR Ao EB 24, 
13, 26, 1, 2, 27, 38, 15 排序 , FRAT BB OS He f PT RH A V PE REEF , 得 到 上， 
13, 24. 26, 2. 15, 27, 38， 然 后 , 将 这 两 部 分 合并 、 最 后 得 到 1, 2, 13, £5, 24. 26, 27. 
38. 该 算法 是 经 典 的 分 治 (divide-and-conquer) 策 上 略 ， 性 将 问题 分 成 一 些小 的 问题 然后 递归 求 
SL. 而 治 的 阶段 则 将 分 的 阶段 解 得 的 和 个 答案 修补 到 一 起 。 分 洛 必 递归 非常 有 力 的 用 法 , 我 
f T2: E URSI. | 

归并 排序 的 一 种 实现 方法 在 图 7.9 Pee th. 这 个 称 为 Mergesort 的 过 程 让 是 递归 例 程 
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MSort 的 一 个 驱动 程序 : 


void l 
MSort( ElementType A[ ], ElementType TmpArrayr ], i 
int teft, int Right } | 
Ld 


| int Center: 
iff Left < Rignt ) 
i 
Center = € Left + Right ) / 2: 
MSort( 4, Tmpárray, Left, Center 5; | 
MSart( A, TmpArray, Center + 1, Right ); | 
Merge A, TmpArray, Left, Center + 1, Right 3; 
t 
} 


void 
Mergesort( ElementType AL ], tnt N } 


i 
ElementType *TmpArray; 


TmpArray = malloc M * sizeof ElementType 5 3; 
ifi TmpArray != NULL } 


{ 
| MSort( A, TmpArray, D, N - 1 2; 
| free( TmpArray ); 

} 


else 
FatalError( "No space for tmp array!!!" J; 


图 7-9 归并 排序 例 程 


一 一- 


Merge 例 程 是 精妙 的 ， 如 采 对 Merge 的 每 个 递归 调用 均 局 部 声明 一 个 临时 数组 , 那么 在 
任 一 时 刻 就 可 能 有 log N 个 临时 数组 处 在 活动 期 , 这 对 于 小 内 存 的 机 器 则 是 致命 的 ， 邦 一 方 
fit. 如果 Merge 例 程 动态 分 孔 并 释放 最 小 量 临时 内 存 , ABA malloc 占用 的 时 间 会 很 多 P 
密 测 试 指出 , 由 于 Merge 位 于 MSor 的 最 后 一 行 , AU TE TE— A Re EF s BERI i 
动 ,而 旦 可 以 使 用 该 临时 数组 的 任意 部 分 ; 我 们 将 使 用 与 输入 数组 A 相间 的 部 分 , 这 就 达到 
本 节 林 昆 描述 的 改进 。 图 7-10 实现 了 这 个 Merge 例 程 。 


7.6.1 归并 排序 的 分 析 
IHF EMSAM RAEN AACA, 我 们 必须 给 运行 时 间 写 出 一 个 递归 关 

A. 假设 N B20. 从 而 我 们 总 可 以 将 它 分 裂 成 均 为 偶数 的 两 部 分 .对 于 N = 1, 归并 
排序 所 用 时 间 是 常数 , 我 们 将 记 为 1。 否 则 , 对 N 个 数 归 并 排序 的 用 时 等 于 完成 两 个 大 小 为 
N/2 的 递归 排序 所 用 的 时 间 再 加 上 合并 的 时 间 , 它 是 线性 的 .下 述 方 程 给 出 准确 的 表示 : 

TU) = 1 

T(N)  2T(N/2) +N 
这 是 一 个 标准 的 递归 关系 , 它 可 以 用 多 种 方法 求解 。 我 们 将 介绍 两 种 方法 。 第 Te 
N 去 除 递 归 关 系 的 两 地， 你 很 快 就 会 发 现 这 人 么 做 的 理由 。 相 除 后 得 到 

TON) | T(N/ 22 , 

N N/2 

该 方程 对 2 的 每 的 任意 的 N 是 成 立 的 , 我 们 还 可 以 写成 

T(N/2). T(N/4) | | 


N/2 N/4 








| /* Lpos = start of left half, Rnos = start of right half */ 
| void 
, Merge( ElementType AL J, ElementType TmpArray[ ], 
| int Lpos, int Rpos, int RightEnd 7} 
i 
| mit i, LeftEnd, kunbElements, TmpPos: 
LeftEnd = Rpos - 1; 


TmpPes = Lpos; 
HumElements = RightEnd - Loos + 1; 


| 
| 
| 
white¢ Lpos «= LeftEnd && Rpas <= RightEnd } | 
ifC AL Lpos ] <= AL Rpos ] ) | 
TmpArray[ TmpPos++ ] = Af Lpost++ ]; | 
else | 
TmpArray | TmpPos++ ] = Ai Rpos++ J; 
| 
while( Lpos <= LeftEnd ) /* Copy rest of first half */ | 
Tmpårray[ TmpPas++ ] = AL Lpos++ 7; 
while( Rpos <= RightEnd ) /* Copy rest of second half */ | 
TmpArray( TmpPos++ ] = AL Rpos++ 2; | 
/* Copy TmpArray back 7/ . 
far( i = Di i < NumElements; i++, Right£nd-- ) 


/* main loop */ 
i A[ RightEnd ] = TmpArray[ RightEnd ]; 


JA 7-10 Merge DLE 


TINA) 一 - TUNA) 十 1 


一 一 


N/4 NA 


TD TO), , 


2 l 
将 所 有 这 些 方 程 相 加 ,就 是 说 , HGS A TT I RRS E E A R 
和 项 LNA2)ACN/2) 出 现在 等 号 两 过 可 以 消去 。 事实 上 , 实际 出 现在 两 边 的 项 均 被 消 
二 ,我 们 称 之 为 看 缩 (telescoping) 求 和 在 所 有 的 加 法 完成 之 后 , 最 后 的 结 轨 为 


TIN) FO) oy 
N 一 i + log 1 


RD BRAT Ec too oa e T V JH ERO AUS log N 个 , 故而 将 各 方程 末尾 的 1 相册 起 
来 得 到 log N。 再 将 两 边 同 乘 以 N ,我 们 得 到 最 后 的 答案 
TON) = Nlog N + N= O(N log ND 

px». LAUER C DEOR AEE AS EA GR ED N, 那么 两 边 的 和 也 就 不 可 能 丢 锯 。 这 就 是 为 
什么 我 们 要 通 除 以 N 的 缘故 。 

另 一 种 方法 是 在 i 边 连 续 地 代 人 递归 关系 。 我 们 得 到 

TON) = 2T(N/) + N 
既然 我 们 可 以 将 N Z2 代入 到 上 面 的 方程 中 
2TONZ2) = 20QUTUNVA)) + NAZ) = ATONZA) 1 N 

因此 得 到 
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TON) = 47CN/4) * 2N 
贞 将 代入 到 上 面 的 等 式 中 去 , 我 们 看 到 
AT(N/4) = A(QTUNZS)) + NA) = RT(N/8S) AON 
因此 我 们 有 
TON) = STON/8) + 3N 
将 这 种 方式 继续 下 去 ,得 到 
TON) = 2*TUN 2°) RN 
利用 上 = log NN ,我 们 得 到 
TON) = MT + Nlog N Nlog N +t N 

选择 使 用 哪 种 方法 是 风格 问题 。 第 一 种 方法 引起 一 些 磺 碎 的 1 作 . 把 它 与 到 一 张 标 准 的 
8 L X11 的 纸 上 可 能 更 好 , 这 样 会 少 出 些 数 学 错误 , TAR HES ENAR. BLAAIE 
更 偏重 于 使 用 蛮 力 进行 计算 . 

回忆 我 们 已 经 假设 N = 2 分析 可 以 更 如 精细 以 处 理 N 不 是 2 的 竺 的 情形 ,事实 上 ， 
答案 几乎 是 一 样 的 (通常 出 现 的 就 是 这 样 的 情形 ). 

虽然 归并 排序 的 运行 时 间 是 O(N log ND. 但 是 它 很 难 用 于 主 存 排序 . 主 改 问题 在 于 从 
并 两 个 排序 的 表 需 要 线性 附加 内 存 , 在 整个 算法 中 还 鉴 花费 将 数据 拷贝 到 临时 数组 再 拷贝 回 | 
来 这 样 - 些 附 加 的 工作 . 其 结果 严重 放 慢 了 排序 的 速度 ， 这 种 拷贝 可 以 通过 在 递归 变 符 层次 
时 审慎 地 转换 A 和 TmpArray 的 角 双 得 利加 和 免 。 归 并 排序 的 一 种 变形 也 村 以 非 递 归 地 实现 
(WW) 7.14), 但 即使 这 样 , 对 于 重要 的 内 部 排序 应 用 而 言 ， 人 们 还 是 选择 快速 排序 , 我 们 
将 在 下 - 节 描 述 这 种 算法 。 不 过 ,本章 稍 后 就 会 看 人 到， 合并 的 例 程 必 大 多 数 外 部 排序 算法 的 
A. 
7.7. 快速 排序 

正如 它 的 名 字 所 标示 的 , 快速 排序 (quicksort) 是 在 实 践 中 量 快 的 已 知 排序 算法 , 它 的 平 
均 运 行 时 间 是 O(N log N), 该 算法 之 所 以 特别 快 ， 主 此 是 由 于 非常 精炼 和 高 度 优化 的 内 部 
循环 。 它 的 最 坏 情 形 的 性 能 为 OCN?), 但 稍 加 公 力 就 可 避免 这 种 情形 。 虽 然 多 年 来 快速 排 
序 算法 被 认为 是 理论 上 高 度 优 化 而 在 实 距 中 却 不 可 能 正确 编程 的 一 种 算法 , 但 是 如 今 该 算法 
简单 易 懂 而 且 不 难 证 明 。 像 归并 排序 一 样 , 快速 排序 也 是 - -种 分 治 的 递归 算法 : 将 数组 5 排 
序 的 基本 算法 由 下 列 简单 的 四 步 组 成 ; 

1. 如 果 5 中 元 素 个 数 是 0 或 1, 则 返回 : 

2. RS PHT v, ZARA piwot). 

3. WR S — {vis 中 其 余 元 素 ) 分 成 两 个 不 相交 的 集合 : S17 reS 一 luv! .zx 之 vw! 和 
S.— jrES- {ul ! revi 

4. 返回 jquicksort(S ii, 继 随 v. 继而 quicksort( S2 ; 

由 于 对 那些 等 于 枢纽 元 的 元 素 的 处 理 ， 第 (3) 步 分 割 的 描述 不 足 慌 一 的 , 因此 这 就 成 了 
一 个 设计 上 的 决策 。 一 部 分 好 的 实现 方法 是 将 这 种 情形 尽 可 能 有 效 地 处 理 。 直观 地 看 ,我们 
项 望 把 等 于 概 组 元 的 大 约 一 半 的 关键 字 分 到 Si 中 ,而 另外 的 一 半分 到 S P. RERNE E 
— LARRE YM- FE. 


[233] 


[234] 


{78 57$ 


GC L——-. LL——- 
一 -一 一 - —— 


i E 7-11 ARERR HEHOS — PRE, xx RERUM CRB LRA 的 ,集合 中 其 余 
FUR A AS BASES 递归 地 将 较 小 的 数 的 集合 排序 得 到 0, 13, 26, 31, 43, 57 GEIH 
法 则 3) ， 较 大 的 数 的 集合 类 似 处 理 , 此 时 整个 集合 的 排序 很 痉 易 得 到 。 





对 小 者 的 快速 排序 对 大 者 的 局 速 排 序 
$ i 
IDE» 
^w - "4 


0 13 26 31 G 57 65 75 81 92 


图 7-1! 说 明快 速 排 序 各 步 的 例子 


应 该 清楚 该 算法 是 成 立 的 , 但 是 不 清楚 的 是 , 为 什么 它 比 归并 排序 快 。 如 问 归并 排序 屠 
E, 快速 排序 递归 地 解决 两 个 子 问题 并 需要 线性 的 附加 工作 (第 (3) 步 ), 不 过 , 与 归并 排序 不 
同 , 这 两 个 子 问题 并 不 保证 共有 相等 的 大 小 , 这 是 个 潜在 的 隐患。 快速 排序 更 快 的 原因 在 
xo 第 (3) 步 分 割 成 两 组 实际 上 是 在 适当 的 位 置 进 行 并 量 非 常 有 效 , 它 的 高 效 弥 宰 了 大 小 不 
等 的 递归 调用 的 缺憾 而 且 还 有 越 出 。 

次 今 为 下 ,对 该 算法 的 描述 尚 忽 少 许多 细节 , 我 们 现在 就 来 补充 这 些 细 定 。 实现 第 (2) 
步 和 第 (3) 步 有 许多 方法 ; 这 里 介绍 的 方法 是 大 量 分 析 和 经 验 研 究 的 结 采 ， 它 代表 实现 快速 
排序 的 非常 有 效 的 方法 ， 哪怕 即使 是 对 该 方法 最 微小 的 偏差 都 可 能 引起 意 想不到 的 不 民 
Ro 


7.7.1 选取 枢纽 元 

虽然 上 面 描述 的 算法 无 论 选 拌 哪个 元 素 作 为 枢纽 郊 都 能 完成 排序 工作 , 但 是 有 些 选 择 显 
PREIE- 

一 种 错误 的 方法 

通常 的 ,没有 经 过 充分 考虑 的 选择 是 将 第 一 个 元 素 用 作 枢 纽 元 。 如 果 输 入 起 随机 的 , 那 
么 这 是 可 以 接受 的 , 但 是 如 果 输 入 是 预 排序 的 或 是 反 序 的 , 那么 这 样 的 枢纽 无 就 产生 一 个 劣 
质 的 分 割 , 因为 所 有 的 元 素 不 是 部 被 划 A S. 就 是 都 被 划 人 Sa BREA, MOU! RE 
生存 所 有 的 递归 调用 中 。 实 际 上 上， 如 果 第 . -- 个 元 素 几 作 枢纽 元 而 月 输入 是 现 先 排序 的 , 那么 
快速 排序 花费 的 时 间 将 是 二 次 的 , 可 足 实 际 上 上 却 根本 没 干什么 事 , DY. SRT, 
预 排序 的 输入 (或 具有 -大 段 予 排序 数据 的 输入 ) 是 相当 常见 的 , 网 此, 使 用 第 一 个 元 素 作 为 
椒 纽 元 是 绝对 糟糕 的 主意 , 应 该 立即 放弃 这 种 想法 、 另 一 种 想法 是 选取 前 两 个 互 民 的 关键 字 
中 的 较 大 者 作为 枢纽 元 , 不 过 这 和 只 选取 第 一 个 元 素 作 为 枢纽 元 具有 相同 的 害处 。 不 要 使 用 
xx Pi Fh Ex FAR COS TR ER o 
一 种 安全 的 作法 

- -种 安全 的 方针 是 随机 选取 枢纽 元 。 一 般 来 说 这 种 策略 间 常 安全 ,除非 随机 数 生 成 认 有 
问题 ( 它 木 像 你 可 能 想像 的 那么 罕见 ), 因为 随机 的 枢纽 元 不 可 能 总 在 接连 不 断 地 产生 劣质 的 
Hg. 5 -方面 , 随机 数 的 生成 一 般 是 昂贵 的 , 根本 减少 不 了 算法 其 余部 分 的 平均 运行 
上 时间 . 

三 数 中 值 分 割 法 (Medqian-of-Three Partitioning) 

一 组 N 个 数 的 中 值 是 第 [ NZ] 个 最 大 的 数 。 枢纽 元 的 最 好 的 选择 是 数组 的 中 值 。 不 六 
b. IRE, 莫 明 显 减 慢 快 速 排序 的 速度 。 这 样 的 中 值 的 人 千 计 车 避 以 道 过 随机 选取 二 
个 元 泰 并 用 它们 的 中 值 作为 枢纽 元 而 得 色 。 事 实 上 , 随机 性 并 没有 多 大 的 帮助 ， 因 此 -… 般 的 
做 法 是 使 用 云端 、 右 庙 利 中心 位 置 上 的 三 个 元 素 的 中 值 作为 枢纽 无 。 例 如 ,和 输 人 为 8，1, 4， 
9.6,3,5, 2, 7, 0, 它 的 左边 元 素 是 8, 右边 元 素 是 人 0， 中 心 位 置 (| (Left + Right }/2 D EM) 
元 素 是 6。 于 是 枢纽 元 则 是 o= 6。 显 然 使 用 三 数 中 值 分 割 法 消除 了 预 排序 输入 的 坏 情形 
(在 这 种 情形 下 ,这 些 分 割 都 是 一 样 的 )， 并 且 减 少 了 快速 排序 大 约 596 的 运行 时 间 。 

7.7.2 分 割 策略 

有 了 几 种 分 割 策略 用 于 实践 ,但 此 处 描述 的 分 割 方 法 能 够 给 出 好 的 结果 。 我 们 将 会 看 到 ， 
它 很 容易 做 错 或 产生 低 效 ,不 过 使 用 一 种 已 知 的 方法 却 是 安全 的 。 该 法 的 第 一 步 是 通过 将 杠 
纪元 与 最 后 的 元 索 交 贺 使 得 枢纽 元 离开 变 被 分 吕 的 数据 段 。;i 从 第 一 个 元 素 开始 而 ; 从 倒数 
第 二 个 元 素 开 始 。 如 果 最 初 的 输 人 与 前 面 一 样 ， 那么 直面 的 图 表示 当前 的 状态 。 


t i 


我 们 暂时 假设 所 有 的 元 素 互 异 , 后 面 我 们 将 着 重 考虑 在 出 现 重复 元 素 时 应 该 怎么 办 - TE 
为 “种 限制 性 的 情形 , 如 果 所 有 的 元 素 都 相同 ,那么 我 们 的 算法 必须 做 相应 的 工作 。 可 是 厅 
怪 的 是 ,此 时 做 错 事 却 特别 地 容易 。 

在 分 割 阶段 要 做 的 就 是 把 所 有 小 元 素 移 到 数组 的 左边 而 把 所 有 大 元 素 移 到 数组 的 右边 ， 
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当然 ,“ 小 ”和 “大 ”是 相对 于 枢纽 元 而 言 的 - 

当 i 在 ; CIN, 我 们 将 ; 右 移 , 移 过 那些 小 于 枢纽 元 的 元 素 , 并 将 A. 移 过 那些 
大 于 枢纽 元 的 元 索 。 当 Ay 停止 时 ,， 指 回 一 个 大 无 素 而 7 HIT). WR: 在 j 的 
左边 , 那么 将 这 两 个 元 素 互 换 ， 其 效果 是 把 一 个 大 元 束 移 向 右边 而 把 一 个 小 元 素 移 向 天边 ， 
在 上 面 的 例子 中 , i 不 移动 , RII DR. 情况 如 下 图 。 


Lad 
一 





在 最 后 一 步 ， 当 枢纽 元 与 ; 所 指向 的 元 素 交 换 时 , 我们 知道 在 位 置 P < i 898 — 7L 
都 必然 是 小 元 素 , 这 是 因为 或 者 位 置 P 包含 一 个 从 它 开始 移动 的 小 元 素 , MAP 上 上 原来 
的 大 元 素 在 交换 期 间 被 置换 了 。 类 似 的 论断 指出 , 在 位 置 P > i 上 的 元 素 必 然 都 是 大 元 率 。 

我 们 必须 考虑 的 一 个 重要 的 细节 是 如 何 处 理 那些 等 于 枢纽 区 的 关 串 子 。 问题 在 于 当 38 
到 一 个 等 于 枢纽 元 的 关键 字 时 ,是 否 应 该 停止 以 及 当 j 遇 到 一 个 等 于 枢纽 元 的 关键 学 时 是 全 
应 该 停止 。 直 观 地 看 ，i 和 j 应 该 做 相同 的 工作 ,因为 否则 分 割 将 出 现 馈 问 - Fite. 95 
hn, We i 停止 而 j RS. 那么 所 有 等 于 枢纽 元 的 关键 字 都 将 被 分 到 S. Po 

为 了 搞 清 怎 么 办 更 好 , 我 们 考虑 数组 中 所 有 的 关键 字 都 相等 的 情况 ， 如 果 i 和; 部 停止 ， 
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那么 在 相等 的 元 素 间 将 有 很 多 次 交换 。 虽 然 这 似乎 没有 什么 意义 , 但 是 其 正面 的 效果 则 是 i 
$0; Here Ta eS, 国 此 当 枢 纽 元 被 蔡 代 时 , 这 种 分 荐 建立 了 两 个 几乎 相等 的 子 数 组 。 归 并 
排序 分 析 告 诉 我 们 , 此 时 总 的 运行 时 间 为 O(N log N)。 

BSE i 和 j 都 不 停止 , 那么 就 应 沪 有 相应 的 程序 防止 i yp 越 出 数组 的 界限 ,不 进行 交换 
的 操作 。， 虽 然 这 样 似 乎 木鱼 , 但 是 正确 的 实现 方法 却 是 把 枢纽 元 交换 到 i 最 后 到 过 的 你 置 ， 
这 个 位 置 是 倒数 第 二 个 位 置 { 或 最 后 的 位 置 , 这 依赖 于 精确 的 实现 方法 )}、 这 样 的 做 法 将 会 产 
生 两 个 非常 不 殉 衡 的 子 数 组 。 如 果 所 有 的 关键 字 部 是 相同 的 , 那么 运行 时 间 则 足 OC N*). 
StF RHEE Ma An eS, 其 效果 与 使 用 第 一 个 元 素 作为 枢纽 元 相同 。 它 花费 的 时 间 是 二 次 的 
可 是 却 什 么 事 也 没 干 ! 

这 样 我 们 就 发 现 ， 进行 不 必要 的 交换 建立 卫 个 均衡 的 子 数 组 要 比 蛮 王 冒险 得 到 两 个 不 均 
衡 的 子 数组 好 。 因 此 ,如 果 7 和; 遇 到 等 于 椒 纽 元 的 关键 字 , 那么 我 们 就 让 i Aly AMIE. XI 
于 这 种 输入 , 这 实际 上 是 不 花费 二 次 时 疝 的 四 种 可 能 性 中 惟一 的 一 种 可 能 。 

初 看 起 米 , sp ERE ELA CAMRY AHAB. MBS AE 5 008 个 相同 
的 元 素 排序 吗 ? 为 什么 ? 我 们 记得 , 快速 排序 是 递归 的 . WES 100 000 个 元 素 , 其 中 有 5 000 
个 是 相同 的 。 最 后 , 快速 排序 将 对 这 5 000 个 元 素 进 行 递归 调用 。 此 时 , 真正 重要 的 在 于 确 
保 这 5 000 个 相同 的 元 素 能 够 被 有 效 地 排 到 。 

7.7.3 小 数组 

对 于 很 小 的 数组 (NE 20), 快速 排序 不 如 栖 人 排序 好 。 不 仅 如 此 , 因为 快速 排序 是 递归 
的 .所 以 这 样 的 情形 还 经 常 发 生 。 通 常 的 解决 方法 是 对 于 小 的 数组 不 递归 地 使 用 快速 排序 、 
而 代 之 以 诸如 播 人 排序 这 样 的 对 小 数组 有 效 的 排序 算法 。 使 用 这 种 策略 实际 上 可 以 节省 大 约 
Is 此 (相对 于 自始至终 使 用 快速 排序 时 ) 的 运行 时 间 。 一 种 好 的 截止 范围 (cutoff range) Zé N 
= 10, 里 然 在 5 到 20 之 癌 任 -截止 范围 都 有 可 能 产生 类 似 的 结果 。 这 种 做 法 也 避免 了 一 此 
有 害 的 特殊 情形 , 如 取 三 个 元 素 的 中 值 而 实际 上 却 只 有 -~- 个 或 两 个 元 素 的 情 沉 。 

7.7.4 实际 的 快速 排序 例 程 

快速 排序 的 驱动 程序 见 图 7-12。 


void 
Quicksort( ElementType At J, int N ) 
i 





图 7-12 快速 排序 的 驱动 程序 


这 种 例 程 的 一 般 形式 将 是 传递 数组 以 及 被 排序 数组 的 范围 Left (Am) RI Right Cm) 
点 外 理 的 第 一 个 例 程 是 枢纽 元 的 选取 。 选 下 枢纽 元 晤 容易 的 方法 是 对 Al Left |. A Right]. 
A Center | 适当 地 排序 。 这 种 方法 还 有 额外 的 好 处 , 即 该 三 元 素 中 的 最 小 者 被 分 在 A LLeft |. 
而 这 正 是 分 割 阶 段 应 该 将 它 放 到 的 位 置 。 三 元 素 中 的 最 大 者 被 分 在 AL Right |, 这 也 是 正确 
MOLE. 因为 它 大 于 枢纽 元 。 因 此 , 我 们 可 以 把 伐 纽 元 放 到 AT Right 一 11 并 在 分 割 阶段 将 ; 
和 ; 初始 化 到 Left + 1 和 Right - 2, 因为 AL Left loh, 所 以 将 它 用 作 ; 的 警戒 标 
记 , 这 是 另 一 个 好 处 。 因 此 , 我 们 不 必 担 心 ; HR. i 将 停 在 那些 等 于 枢纽 元 的 关键 宇 
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ah, 故 将 枢纽 元 存储 在 A Right ~ 11, 将 提供 - :个 警戒 标记 。 图 7-13 中 的 程序 进行 二 数 中 
(AE. 它 具 有 所 撒 述 的 所 有 附加 的 作用 : 似乎 使 用 实际 上 不 对 Al Left]; AL Right], A 
[Center] 排 序 的 方法 计算 根 纽 工 只 不 过 效率 稍微 降低 一 些 , 但 是 很 奇怪 , 这 将 产生 趟 结果 ( 见 















/* Return median of Left, Center, and Right */ 
/* Order these and hide the pivot */ 


ElementType 
Mediani( ElementType A[ ]. int Left, int Right 3 


+ 


int Center = ( Left + Right ) / 2; 


| ift AL Left ] > AL Center ] ) 
Swap( &&[ Left ], &AI Center ] »; 
ifi AL Left 3 > AE Right j } 
Swap( &A[ Left ], &A[ Right ! 3; 
: ift AÇ Center J > AL Right ] 2 
Swap( &A[ Center ], &&[ Right ] 3: 


/* Invariant: A[ Left ] <= Af Center ] <= AL Right ] */ 


Swap( @Af Center J, &A[ Right - 11 2; /* Hide pivot */ 
/* Return pivot */ 


return AL Right - 1 ]; 
} 


图 7-13 实现 二 数 中 值 分割 方法 的 程序 






#define Cutoff ( 3) 















void 
Qsort( ElementType A[ J, int Left, int Right 2 
Í 

int i, d: 

ElementType Pivot; 


/* if if{ Left + Cutoff <= Right > 
{ 
J+ 2*/ Pivot = Median3( A, Left, Right 3; 
/* Sr i = Left; j = Right - 1; 
ft arf for( ; i} 
{ 
f= 5*/ while( AT ++i ] < Pivot J: 
* uf whilet A[ --j ] > Pivot M } 
fe Fey iff i<j) 
A 8*/ Swap( SAL i 1, &AL j ] 5; 
else 
/* 9*/ break; 


} 
/*lo*/ Swapt &A[ 3 ], &A[ Right - 1 ] J; /* Restore pivot */ 









f/*1l*/ Qsort( A, Left, 一 1X; 
i Qsart( A, i + 1, Right }; 
} 
else /* Do an insertion sort on the subarray */ 


/*13*/ InsertionSort( A + Left, Right - Left + 1 7; 





图 7-14 快速 排序 的 主 例 程 


El 7-14 的 程序 是 快速 排序 真 目的 核心 。 它 包括 分 割 和 递归 调用 。 这 里 有 几 件 事 值得 注 
意 . 第 3 行将 ; 和 ; 初始 化 为 比 它们 的 止 确 值 超 出 1, 使 得 不 存在 需 紧 考 虑 的 特殊 情况 此 
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BER) rH COR = BCP A ROG EAER, 如 果 按 照 简 单 的 枢纽 元 策略 使 用 
该 程序 而 不 进行 修正 , 那么 这 个 程序 是 不 能 让 确 运 行 的 , 原因 在 于 7 Aj PART RN 
而 不 再 存在 j 的 警戒 标志 。 

第 8 $189 Swap 为 了 速度 上 的 考虑 有 时 显 式 写 出 。 为 使 算法 速度 快 , 需 费 迫使 编 详 器 以 
直接 插 人 的 方式 编译 这 些 代 础 。 为 此 需 归 , 许多 编译 器 都 将 自动 这 么 做 , 但 对 于 不 这 公司 的 
MIERE, 差别 可 能 很 明显 。 

An. 从 第 5 行 和 第 6 行 可 看 出 为 什么 快速 排序 这 人 么 快 : 算法 的 内 部 循环 由 -个 增 IA 
] 运算 ( 它 很 快 )、 一 个 测试 , 以 及 一 个 转移 组 成 。 该 算法 没有 像 在 轨 并 排序 中 邦 样 的 额外 技 
巧 ,不 过 ,这 个 程序 仍然 出 奇 好 复杂 。 邻 人 感 兴趣 的 是 将 第 3 行 到 第 9 行 用 图 7-15 中 列 册 的 
语句 代替 ,这 是 不 能 正确 运行 的 , BAB ALi] = ALj] = Pivot 则 会 产生 一 个 无 限 循 环 . 













ft 3*/ Ts Left + 1; j = Right - 7; 
/* A for( i 1) 
i 


| fe ote while( A[ 1 ] < Pivot 5 i++; 
/* 6*7 while( AL j ) > Pivot ? j--: 
Q0 £5 T*/ if€i< j 2 
/* Bef Swap( &A[ i J, &A[ j 1 5: 
pisa 
| fe 9*7 


E 7-15 对 快速 排序 小 的 改动 , 它 将 中 断 该 算法 


7.7.5 快速 排序 的 分 析 

正如 归并 排序 那样 , 快速 排序 也 是 递归 的 , 因此 , 它 的 分 析 需 要 求解 一 个 递 推 公式 : 我 
们 将 对 快速 排序 进行 这 种 分 析 , 假设 有 一 个 随机 的 枢纽 元 (不 用 三 数 中 值 分 割 法 ), 对 一 些小 
的 文件 也 不 使 用 截止 范围 。 和 归并 排序 一 样 , 取 TO) = TO) = 1, 快速 排序 的 运行 时 间 
等 于 两 个 递归 调用 的 运行 时 间 加 上 花费 在 分 割 上 的 线性 时 间 ( 枢 纽 元 的 选取 仅 花 费 常数 时 
间 )。 我 们 得 到 基本 的 快速 排序 关系 : 


TIN) = T(i) + TUN- i- 1) t cN (7.1) 
Ep, i = 1S JES, 中 的 元 素 个 数 。 我们 将 考察 三 种 情况 。 
最 二 情况 的 分 析 
枢纽 元 始终 是 最 小 元 素 。 此 时 i = 0, 如 果 我 们 忽略 无 关 紧 要 的 0) = 1, 那么 递 推 关 系 为 
T(N})= T(N-1)+eN,N>1 (7.2) 
反复 使 用 方程 (7.2), 我 们 得 到 
T(N-1}= T(N—2}+c(N-1) (7.3) 
TON -2}= TUN-3) t c(N -2) (7.4) 
T(2)= Ti) + c(2) (7.5) 


将 所 有 这 些 方 程 相 加 , 得 到 
T(N) = TO) 1 c2, i = ONF) (7.6) 


这 正 是 我 们 前 面 宣布 的 结果 。 
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最 好 情况 的 分 析 
在 最 好 的 情况 下 , 枢纽 元 正好 位 于 中 间 - 为 了 简化 数学 推导 , 我 们 假设 两 个 子 数 组 恰好 
各 为 诛 数 组 的 一 半 大 小 , 虽然 这 会 给 出 稍微 过 高 的 合计 , 但 是 由 于 我 们 只 关心 大 ORR, N 
结果 还 是 可 以 接受 的 。 
TEN) 22TUNZ 2) * cN (7.7) 
ALN ERDE. T) SPA, 
T(N) T(N/2), 








N ^ N/2 TS (7.8) 
我 们 反复 套用 这 个 方程 , 得 到 
T(N/2 / 
Ns Nat (7-9) 
TOUS). TNS) , te (7.10) 
TOL IU, (7.10) 
将 其 47.73 到 (7.11) 的 方程 如 起 来 ,并 注意 到 它们 共有 log NT, FE 
TIN) - TCU + clogN (7.12) 
由 此 得 到 
TUN) = cNlogN + N= O( NlogN) (7.13) 
注意 ,这 和 归并 排序 的 分 析 完 全 相同 , 因此, 我 们 得 到 相同 的 管 案 。 
平均 情况 的 分 析 


这 是 最 难 的 部 分 。 对 于 平均 情况 , 我 们 假设 对 于 S 每 一 个 文件 大 小 都 是 等 可 能 的 , A 
此 每 个 大 小 均 有 概率 1AN。 这 个 假设 对 于 我 们 这 里 的 枢纽 元 选取 和 分 割 方法 实际 上 是 台 理 
的 , 不 过 , 对 于 某 些 其 他 情况 它 并 不 合理 。 那 些 不 保持 子 文件 (subfile) 随 机 性 的 分 割 方法 个 
能 使 用 这 种 分 析 方 法 . 有 趣 的 是 ， 这些 方法 看 来 导 至 程序 在 实际 运行 中 论 费 中 长 的 轩 站 。 

由 该 假设 可 知 ，T( 站 (从 而 TON — i — 1)) 的 平均 值 为 (17N) 21, TUO 。 此 时 方程 
{7.1) 变 成 


rin) = 2033 TG) |+ oN (7.14) 
如 果 用 N 乘 以 方程 (7.14)， 则 有 B 
wr) = 2| S 70] cN? (7.15) 
我 们 需要 除去 求 和 符号 以 简化 计算 。 ERE. 我 们 可 以 再 套用 一 次 方程 (7.15), 得 到 
(N - DTN -D = [XT] e 1) (7.16) 
车 从 (7.15) 减 去 (7.16), 则 得 到 7 
NT(N) -E(N- D TUN - D 22TUN - 1) +2c0N - e (7.17) 


移 项 、 合 并 并 除去 右边 无 关 紧 要 的 项 -“ , 我 们 得 到 
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NTON)-GON* D TON -1) * 2cN (7.18) 

HEA -ARATIN - Dm T(N REAA., HRALA, Aih e 
{7.18) 的 形式 不 适合 。 为 此 , 用 NtN +1) 除 方程 (7.18): 
TON) | TIN-D , 2c. 











N+1 N N«1 (7.19) 
MATUTE 
TUN -1) T(N-2 
TND- a +e (7.20) 
T(N-2). T(N- 
(N- ? = Ty + 二 和 (7.21) 
T(2)__T c 
TO) DD V2 (7.22) 
将 方程 (7.19) 到 (7.22) 相 加 , 得 到 
ATi 
TCN) _ TQ) ZO 4 (7.23) 


该 和 太 约 为 log,(N + 1) + at 其 中 ye. 577 HARRES A Euler's constant), TJ 


TUN) _ 
NI 





O(logN) (7.24) 


从 而 
T(N} = OCNlogN) (7.25) 

虽然 这 里 的 分 析 看 似 复 杂 , 但 是 实际 上 并 不 复杂 一 一 一 旦 你 看 出 某 些 递 推 关系, 这 些 步 
又 中 很 自然 的 。 该 分 析 实 际 上 还 可 以 再 进一步 。 上 面 描述 的 高 度 优 化 的 形式 也 中 经 被 分 析 
过 , 结果 的 获得 非常 困难 , 涉及 到 一 些 复杂 的 递归 和 高 深 的 数学 ， 相 等 关键 字 的 影响 也 己 仔 
细 地 进行 了 分 析 , 实际 上 所 介绍 的 程序 就 是 这 么 做 的 。 

7.7.6 选择 的 线性 期 望 时 间 算 法 

可以 修改 快速 排序 以 解决 选择 问题 {selection problem), 这 种 问题 我 们 在 第 1 章 和 第 6 3 
FE 经 看 到 ， 当 时 ， 遂 过 使 用 优先 队列 , 我 们 能 够 以 时 间 O(N + k log N) 找 到 第 个 最 大 
(最 小 ;元 。 对 于 查找 中 值 的 特殊 情况 , 它 给 出 一 个 OCN log NRA. 

由 于 我 们 能 够 以 OCN log N) 时 间 给 数组 排序 , 因此 可 以 期 望 为 选择 问题 得 到 一 个 更 好 
的 时 间 界 。 我 们 介绍 的 查找 集合 S 中 第 有 个 最 小 元 的 算法 几乎 与 快速 排序 相同 。 事 实 上 ， 其 
前 三 步 是 一 样 的 。 我 们 将 把 这 种 算法 时 做 快速 选择 (quickselect)。 令 153i1 为 S, 中 元 素 的 个 
数 ， 快速 选 择 的 步骤 如 下 : 

1 .如果 |S| = 1, BAe = 1, 并 将 S 中 的 元 素 作为 答案 返回 。 如 此 使 用 小 数组 的 截止 
(cutoff) HEB] SICCUTOFF, 则 将 S 排序 并 返回 第 个 最 小 元 : 

2 ,选取 一 个 枢纽 元 vE S. 

3. 将 集合 S - iw! 分 割 成 S, 和 5;， 就 像 我 们 在 快速 排序 中 所 做 的 那样 

4. ip Rec S.l, 那么 第 不 个 最 小 元 必然 在 51 中 。 在 这 种 情况 下 ， 返回 quickselect 
(S,, EK), WHR = 1 + 131i|, 那么 枢纽 元 就 是 第 上 个 最 小 抱 ， 我 们 将 它 作 为 答案 返回 。 人 下 


! 


44 : 


bo 


I 





则 , 这 第 上 个 最 小 匹 就 在 S: P. EE S 中 的 第 ( -IS — 了 1 个 最 小 匹 。 我 们 进行 - OE 
归 调 用 并 返回 quickselect (85, & — 18,, — 1). 

与 快速 排序 对 比 , 快 迷 选择 只 做 了 -次 递归 调用 而 不 是 下 次 ， 快速 选 拌 的 最 坯 情况 利 快 
速 排序 的 相间 , 也 是 OCN). EDUUEGE. 这 是 因为 快速 排序 的 最 坏 情况 发 生 开 S, 和 S: 有 
一 个 是 空 的 时 候 ; Fb, 快速 选择 也 就 不 是 真 的 节省 -- 次 递归 调用 。 不 过 , 平均 运行 时 间 是 
O(N)。 具体 分 析 类 似 于 快速 排序 的 分 析 . 我 们 将 它 留 作 一 道 练习 题 ， 

快速 选择 的 实现 甚至 比 抽象 的 描述 还 去 简单 ,其 程序 见 图 7-16.， 当 算法 终止 时 , WS CT 
最 小 元 就 在 位 置 志 七， 这 破坏 了 原来 的 排序 ; 如 果 不 希 望 这 样 ,那么 需要 微 -一 份 搁 内. 






/* Places the kth smallest element in the kth position */ 
/* Because arrays start at 0, this will be index k-1 */ 
void 

Qselect( ElementType AL ], int k, int Left, int Right ) 
{ 

























int i, j; 
ElementType Pivot: 
ifi Left + Cutoff <> Right J 
Pivot = Mediani( A, Left, Right 3}; 
/* uFi i = Left; j = Right - H; 

fe 4*/ fort ; ; ) 


/* Sy while( A( ++i ] < Pivot 21 3 


} 
else /* Do an insertion sort on the subarray */ 
InsertionSaort( A + Left, Right - Left + I); 


| ft Br whilef AL j ] > Pivet 51 } 
fe Ft iff i<j} 
| /* 8"/ Swapit BAL 1 J], &A[ j ] 3: 
else 
A g*/ break 
} ， 

| /*l0*/ Swap( GAL i ], GAL Right - 1 ] 5); /* Restore pivot */ 

/*11*/ TC k s= ) 

f*12"/ Qselect( A, k, Left, i - 1}; 

/*13"/ else iff k » 7+ 1? 

/*14*/ Qselect( A, k, 7 + 1, Right 5; 
l 


/*15*/ 





图 7.16 快速 选择 的 主 例 程 


合用 三 数 中 值 选 取 枢 纽 元 的 方法 使 得 最 坏 情况 发 牛 的 机 会 几乎 是 微不足道 的 。 然 而 , XE 
过 仔细 选择 松 纽 元 , 我 们 可 以 请 除 二 次 的 最 坏 情况 而 保证 算法 是 O(N) 的 .可 中 这 么 做 的 额 
外 开销 是 相当 大 的 , 因此 最 终 的 算法 主要 在 于 理论 上 的 意义 。 存 第 10 章 我 们 将 考查 选择 问 
题 的 线性 时 间 最 坏 情形 算法 , 我 们 还 将 大 到 选取 枢纽 元 的 一 个 有 趣 的 技巧 , CRER RIA 
在 实践 中 多 少 要 快 一 些 。 
7.8 大 型 结构 的 排序 

关于 排序 的 全 部 讨论 , 我 们 已 经 假设 要 被 排序 的 元 素 是 一 些 简单 的 整数 。 Ti s Be Et 
某 个 美 键 字 对 大 型 结构 进行 排序 。 例 如 , RAT RAL RASC, 每 个 记录 由 姓 
和 名、 地址、 电话 号 码 、 诸 如 工资 这 样 的 财务 信息 、 以 及 税务 信息 组 成 。 我 们 可 能 想 要 通过 一 
个 特定 的 域 ， 比如 姓名 , 来 对 这 些 信 息 进 行 排序 。 对 于 所 有 的 算法 来 说 ， 基本 的 操作 就 是 父 
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所 ,不 过 这 里 交换 两 个 结构 可 能 是 非常 品 贵 的 操作 ， 因 为 结构 实际 上 很 大 ,在 这 种 情况 下 ， 
实际 的 解法 是 让 输入 数组 包含 指向 结构 的 指针 ， 我 们 通过 比较 指针 指向 的 关键 字 ， 并 在 必 娄 
时 交换 指针 来 进行 排序 、 这 意味 着 .所 有 的 数据 运动 基本 上 让 像 我 们 对 整数 排序 那样 进行 
我 们 称 之 为 间接 排序 (indireet soring); 可 以 使 用 这 种 方法 处 理 我 们 已 经 描述 过 的 大 部 分 数据 
LM] ”这 证 明 我 们 关于 复杂 数据 结 愧 处 理 时 不 必 大 眉 策 禾 效 率 的 假设 是 正确 的 。 


7.9 排序 的 一 般 下 异 


贡 然 我 们 得 到 一 些 OCN log NN) 的 排序 算法 . 但 是 , 疝 不 清楚 我 们 是 天 还 能 做 得 现 好 . 
本 节 我 们 证 明 , 任何 只 用 到 比较 的 算法 在 最 坏 情 沉 下 需要 QCN log NYRR OMT AON 
log NATH), 央 此 归并 排序 和 堆 排 序 在 --- 个 常数 央 子 范 赎 内 是 最 优 的 ， 访 证明 可 以 进 - - 
步 证 明 即 使 是 在 平均 情况 下 ， 只 用 到 比较 的 任意 排序 算法 都 逢 要 进行 QUON log NOIR IERI 
这 意味 着 . 快速 排序 在 相差 一 个 常数 因子 的 范 央 内 平均 是 最 优 的 

特别 地 ， 我 们 将 证 明 下 列 结果 : 只 用 到 比较 的 任何 排 厅 算法 在 最 乐 情况 下 郭 需要 
[log NT) 次 比较 并 平均 需要 log( NT 次 比较 。 我 们 将 假 衣 ,所 有 N 个 元 素 是 互 蜡 的 ,因为 
(E(u) AEF BE AR Se CER PE REST 
7.9.1 决策 树 

Xx RPH decision tree) 昆 用 于 证 明 下 界 的 抽象 概念 。 在 我 们 这 里 . 决策 树 足 一 : 棵 二 义 树 . 
每 个 节点 表示 在 元 素 之 出 一 组 可 能 的 排序 , 它 与 已 经 进行 的 比较 Xx. HERMES ERI 
的 边 . 

图 7.17 中 的 决策 树 表 示 将 二 个 元 素 a, b Fc 持 序 的 算法 。 算 法 的 初始 状态 在 恨 处 
(我 们 将 可 互 换 地 使 用 术语 状态 和 节点 .) 没 有 进行 比较 , 因此 所 有 的 顶 序 都 是 合法 的 。 这 个 
特定 的 算法 进行 的 第 一 次 比较 是 比较 a 入 。 两 种 比较 的 结 朵 导 禾 两 种 可 能 的 状态 .如 厅 
4 € b. 那 么 只 有 二 种 可 能 性 被 保留 .如果 算法 到 达 节 点 2, BAER ILE a 和 re， 其 他 算法 
可 能 会 做 不 同 的 工作 :; 不 同 的 算法 可 能 有 不 同 的 决策 树 ” 若 a > c. 则 算法 进入 状态 5. 由 
于 有 只 存在 一 种 顺序 , 因此 算法 可 以 终止 并 报告 它 已 经 完成 了 排序 . fra «c 划算 法 尚 不 能 
终止 ,因为 存在 两 种 可 能 的 顺序 , 它 还 不 能 肯定 哪 种 是 正确 的 。 在 这 种 迟 况 下 ， 算法 还 将 由 
Gta BER IAE. 

BR ot F(a FL REP HEFE BT 6$ — A RA Be. 4R, 只 有 输入 数据 非常 
少 的 情况 画 诀 策 树 才 是 可 行 的 。 由 排序 算法 所 使 用 的 比较 次 数 等 于 最 深 的 树叶 的 深度 。 在 我 
们 的 例子 中 , 该 算法 在 域 坏 的 情况 下 使 肝 了 二 次 比较 ; 所 使 用 的 比较 的 平均 次 数 等 于 衬 叶 的 
平均 深度 。 由 于 决策 树 很 大 , 因此 必然 存在 一 些 长 的 路 径 。 为 了 证 明 下 规 ， T SE UE AA A ee HE 
Ak REPE I 

s| 7.1 

A TORR Ad 的 二 叉 树 , TRZA TH. 

证 阴 : 

用 数 深 败 纳 法 证 明 。 如 果 = 0. 则 最 多 存在 -个 树叶 , 因此 基准 情况 为 真 : SW, ff 
在 一 个 根 , 它 不 可 能 是 树 时 ， 其 左 子 山 和 右 子 树 中 每 一 个 的 深度 最 多 是 4 一 1 HB 
设 , 每 . 棵 子 树 最 多 有 27-! 个 树 时 ,因此 总 数 最 多 有 24 个 树 呈 ”这 就 让 明了 该 引 理 . 
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acbec beace 
acceb bec<a 
c«a«h e<b<g 
9 9 
a<c cea bec cab 
a<b<c 
z c 
b«c cep acc ea 
8) (9) Q9) QU 
图 7-17 三 元 素 排序 的 决策 树 
引 理 7.2 
BAL 片 树叶 的 二 叉 树 的 深度 至 少 是 | tog L l 
LE AR : 
由 前 曾 的 引 理 立即 推出 。 
定理 7.6 
只 使 用 元 素 问 比较 的 任何 排序 算法 在 最 坏 情 况 下 至 少 需要 | log CN T) | 次 比较 。 
WE AR : 


对 N 个 元 素 排 序 的 决策 树 必 然 有 NT1 个 树叶 。 从 上 面 的 引 理 即 可 推出 该 定理 。 
定理 7.7 

只 使 用 元 素 间 比较 的 任何 排序 算法 需要 进行 A(N log N) 次 比较 。 

证 阴 : 

由 前 面 的 定理 可 知 , 需要 log( N1) 次 比较 。 

log (NT) = log (N CN - D ON - 2)...€2) (1)) 


= log N + log (N - 1) + log (N - 2) +... + log 2 + log 1 
J log N + log (N — 1) + log (N — 2) * ... + log NZ 
N, N 

= log 3 

N ony N 

z^ logN 


=02(N log N} 


A — r —Á—— ———— ——— 
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这 种 类 型 的 下 界 论断 ， 当 用 于 征明 最 二 情形 结 玉 时 ， 有 村 间 做 信息 -理论 (infonnation- 
theorertie) 下 界 。 一般 定理 说 的 是 , WREE PPA SEA, 而 问题 是 YES/NO 的 
形式 , 那么 通过 任何 算法 求解 该 问题 在 某 种 情形 下 总 需要 | log P | 个 问题 。 对 于 任何 基于 比 
较 的 排序 算法 的 半 均 运行 时 间 , 证 明 类 似 的 结果 是 可 能 的 。 这 个 结果 由 下 列 引 理 导 出 ,我 们 
将 它 留 作 练习 ; 具有 工 片 树叶 的 任意 二 叉 树 的 平均 深度 至 少 为 log Lo 


7.10 桶 式 排序 


虽然 我 们 在 上 一 节 证 明了 任何 只 使 用 比较 的 一 般 排序 算法 在 最 坏 情况 下 需要 运行 时 间 
N (N log N), 但 是 我 们 要 记 往 , 在 某 些 特殊 情况 下 以 线性 时 间 进 行 排序 仍然 是 可 能 的 ， 

一 个 简单 的 例子 是 桶 式 排序 (bucket sort). 2o fi Risk HET REGS iE E LE, BAUR Ae 
额外 的 信息 。 输 入 数据 A Ar. ..., An 必须 只 出 小 于 M 的 正 整 数组 成 : 【显然 还 可 以 对 其 
进行 扩充 .) 如 果 是 这 种 情况 , 那么 算法 很 简单 ; 使 用 一 个 大 小 为 M BRA Count 的 数组 , CR 
初始 化 为 全 0。 于 是 ，Count AM 个 单元 (或 称 桶 ), 这 些 桶 初始 化 为 空 。 Mug A; AY, Count 
[A,] 增 1。 在 所 有 的 输入 数据 读 人 人 后, 扫描 数组 Coxnt ,打印 出 排序 后 的 表 。 该 算法 用 时 
OM + ND; 其 证 明 留 作 练 习 。 如 果 M AON), PARE WE OWN). 

虽然 这 个 算法 似乎 干扰 了 下 界 , 但 事实 上 并 没有 ,因为 它 使 用 了 比 简单 比较 更 为 强 太 的 
操作 ”通过 使 适当 的 桶 增值 , 算法 在 单位 时 间 内 实质 上 执行 了 一 个 ML- 路 比较 - 这 类 似 于 用 
在 可 扩散 列 上 的 策略 ( 见 5.6 节 )。 显 然 这 不 属于 那 种 下 界 业 已 证 明 的 模型 。 

不 过 .该 算法 确实 提出 了 用 于 证 明 下 界 的 模型 的 合理 性 问题 。 这 个 模型 实际 上 是 一 个 强 
模型 ,内 为 通用 的 排序 算法 不 能 对 于 它 可 以 预见 到 的 输入 类 型 做 假设 ,但 必须 仅仅 基于 排 抒 
信息 做 一 些 决策 。 很 自然 地 ,如 果 存 存 额 外 的 可 用 信息 ， 了 我 们 应 该 有 望 找 到 于 为 有 效 的 算 
ik, PRU aS) A fae BIR BF I. 

尽管 桶 式 排序 看 似 太平 凡 用 处 不 大 , 但 是 实际 上 却 存 在 许多 其 输入 只 是 一 些小 的 整数 的 
情况 , 使 用 像 快 速 排序 这 样 的 排序 方法 真 的 是 小 是 大 作 了。 


7.11 外 部 排序 


沦 今 为 止 ,我 们 考查 过 的 所 有 算法 都 需要 将 输入 数据 装 人 内 存 。 然 而, 存在 一 些 应 用 三 
E, 它们 的 输 人 数据 量 太 大 装 不 进 内 在。 本 节 将 讨论 一 些 外 部 排序 算法 (external sorting), "E 
们 是 设计 用 来 处 理 很 大 的 输入 的 。 

7.11.1 为 什么 需要 新 的 算法 

大 部 分 内 部 排序 算法 都 用 到 内 存 可 直接 寻 址 的 事实 。 希 尔 排序 用 一 个 时 间 单位 比较 元 系 
ATi) MAL: — 太 ]。 堆 排序 用 一 个 时 间 单位 比较 元 素 A[ 门 和 ALi*2 + 1]。 使 用 三 数 中 
估 分 划 法 的 快速 排序 以 常数 个 时 间 单位 比较 A Left), AC Center ] 各 AL Right]. RASA. 
数据 在 磁带 上 , 那么 所 有 这 些 操作 就 失去 了 它们 的 效率 , 因为 磁带 上 的 元 素 只 能 被 腺 序 访 
J 。 即 使 数据 在 一 张 磁盘 上 ,和 由 于 转动 磁盘 和 移动 位 头 所 党 的 延迟 ,仍然 存在 实 队 上 的 效率 
损失 。 

为 了 看 到 外 部 访问 究 况 有 多 慢 , 可 建立 一 个 大 的 随机 文件 , 但 不 能 太 大 以 致 装 不 进 日 
大 。 将 该 文件 读 入 并 用 一 种 有 效 的 算法 对 其 排序 。 将 该 输入 数据 进行 排序 所 花费 的 时 间 导 将 
其 志和 所 花费 的 时 间 相 比 必然 是 无 足 轻重 的 , 尽管 排序 是 O(N log NO BETTE AIC FUP 


过 化 费 OCNORTIB], 
7.11.2 外 部 排序 模型 

各 种 各 样 的 海量 存储 装 莘 使 得 外 部 排序 比 内 部 排序 对 设备 的 依赖 性 墅 严重 得 多 。 我 们 将 
冶 虑 的 一 些 算 法 在 磁带 上 工作 ,而 磁带 可 能 是 最 受 限 制 的 存 鱼 媒体 。 由 于 访问 伐 带 上 一 个 无 
dn EUR EDU TCR IRI Dr. 因此 磁带 必须 要 有 (了 两 个 方向 上 ) 连 续 的 顺序 才能 够 被 有 效 
地 访问 

我 们 将 假设 至 少 有 二 个 砌 届 驱 动 器 进行 排序 工作 . 我 们 需要 两 个 蝶 动 器 执行 有 效 的 排 
序 ， 而 第 三 个 驱动 器 进行 简化 的 工作 。 如 果 只 有 一 个 态 瑞 蝶 动 器 可 用 , 那么 我 们 则 不 得 不 
说 : 任何 算法 都 将 需要 OLN? ) 次 伐 带 访问 。 
7.11.3 简单 算法 

基本 的 外 部 排序 算法 使 用 归并 排序 中 的 Merge IER. RRIA UHR E. Tu. Tu 
Tu. To, EVER AA RA A a ee. 根据 算 法 的 特点 , 磁带 a 和 磁带 5 BAA 
作 输 入 磁带， 和 要么 用 作 输 出 磁带 。 设 数据 最 初 在 Ta 上 ,并 设 内 存 可 以 -次 容纳 (和 排序 ) M 
个 记录 ， 一 种 自然 的 做 法 是 第 一 步 从 输入 感 带 一 次 读 人 M 个 记录 , 在 内 部 将 这 些 记 录 排 序 ， 
然后 冉 把 这 些 排 过 序 的 记录 交替 肌 写 到 T, SE 有 上。 我 们 将 把 每 组 排 过 序 的 记录 叫做 -个 
Eim). WERE, 我 们 倒 回 所 有 的 磁带 。 设 我 们 的 输入 与 希 尔 排 序 的 例子 中 的 输 
人 数据 相同 . 








Tai 8I 34 11 596 12 35 17 99 28 58 41 735 15 


| Tot 
T; u BEEN 


如 果 M = 3, HE dE pRXE LUE. RS PETRI EEE. 





现在 TA TofS AWB. Se pipe T REIS — T UR CROPS BOT. FEES 
REA T.b.XRR—T—RHKISNUBR. 然后 , 我 们 再 从 每 盘 磁 带 取 出 下 一 个 顺 串 , 全 
Jt. SHE RUNE] 人 ,上 。 继 续 这 个 过 程 , 交替 使 用 TaM To. 直到 Tym ToN E. IH, 
或 者 Ty AM TAS, 或 者 剩 下 一 个 顺 串 。 对 于 后 者 , 我 们 把 剩 下 的 顺 捉 拷贝 到 适当 的 硕 串 
上 cp mE, 并 重复 相同 的 步骤 ,这 一 次 用 两 盘 a 磁带 作为 输入 , PUR o GE 
作为 输出 ,结果 得 到 -… 些 AM 的 顺 早 。 我 们 继续 这 个 过 程 直 到 得 到 长 为 N BTR 

该 算法 将 需要 log( N/M) | 趟 工作 , 外 加 一 - 趟 构造 初始 的 顺 串 。 例 如 , 若 我 们 有 1 000 万 
个 记录 , 每 个 记录 128 MER, 并 有 4 兆 字 季 的 内 存 , 则 第 一 未 将 建立 320 SR, MERTZ 
们 再 需要 9 趟 以 完成 排序 。 我 们 的 例子 再 需要 flog13/31=3 趟 , 见 下 图 所 不 。 
7.11.4 多 路 合并 

如 果 我 们 有 额外 的 磁带 ， 那 么 我 们 可 以 减少 将 输 人 数据 排序 所 需 权 的 趟 数 ,， 通过 将 基本 
的 (2 路 ) 合 并 扩充 为 志 路 合并 就 能 做 到 这 一 点 、 





两 个 顺 申 的 合并 操作 通过 将 每 一 个 输入 磁带 转 到 每 个 顺 串 的 开头 来 完成 。 然 后 ,找到 较 
小 的 元 素 . 把 它 放 到 输出 磁带 上 ,并 将 相应 的 输入 磁带 向 前 推进 。 如 果 有 上 Ende A duas. ED 
么 这 种 关 法 以 相同 的 方式 工作 , MCKIE F, 它 发 现 POR PR CR Bk 
有 此 复杂。 我 们 可 以 通过 使 用 优先 队列 找 出 这 些 元 素 中 的 最 小 元 。 为 了 得 出 下 一 个 写 到 磁 蕉 
上 的 元 素 , 我 们 进行 一 次 DeleteMin 操作 ， 将 相应 的 磁带 向 前 推进 , 如 果 在 输入 磁带 上 的 顺 
串 尚 未 完成 ,那么 我 们 将 新 元 素 揪 入 到 优先 队列 中 。 仍 然 利 几 前 面 的 例子 , 我们 将 输入 数据 
RS AERE EF. 





Ly BER Ra WB zs. 使 用 天 路 合并 所 需要 的 趟 数 为 iogs(N7M) 1, ROS REGALE 
BEEE REA. MF RW. AAEN., FT iog (13/3) = 2. 如果 我 们 有 10 Æ 
磁带 ,此 时 上 有 = 5， 而 前 一 节 的 大 例子 需要 的 趟 数 将 是 | logs320 1= 4. 
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7.11.5 多 相合 并 

二 一 节 讨 论 的 天 路 合并 方法 需 皮 使 用 28 BENE. 这 对 某 些 应 用 极为 不 伍 。 只 使 用 到 +1 
PRAT n ESE HEA TAE. EAB, 我 们 曾 述 只 用 三 盘 硫 带 如 何 完 成 2- 路 台 ?j 

HRR D. TQ Ta. ÆT, 上 有 一 个 输入 文件 , 它 将 产生 34 TIM, -种 选择 
是 在 T; 和 T. 的 每 一 盘 伐 带 中 放 和 17 个 顺 串 。 然 后 我 们 可 以 将 结果 合并 到 T, 上. 得 到 一 
AA 17 个 吸 串 的 磁带 。 由 于 所 有 的 顺 串 都 在 一 盘 伐 带 上 . 因此 我 们 现在 必须 把 其 中 的 一 些 
顺 串 放 到 T. 上 以 进行 另 一 次 的 合并 。 执行 合并 的 迪 辑 方式 是 将 前 8 ARM T, 15 018 T 
并 进行 合并 . 这样 的 效果 起 对 于 我 们 所 做 的 每 一 趟 合并 又 附 即 了 额外 的 半 趋 式 作 ， 

男 一 种 选择 是 把 原始 的 34 MOU Ey ere op AN. BRIE 21 PE Ta 上 而 
把 13 TB IE] T4 上 。 然 后 , E T 用 完 之 前 将 13 TUB RESET, Eo At, 我们 可 以 
EERE 了 AT, 然后 将 具有 13 PTB T, 和 8 个 顺 串 的 T 合并 到 TT 上。 此 时 ,我们 
人 台 并 8 个 顺 串 直到 T; 用 完 为 止 , 这 样 ,在 TT 上 将 留 下 5 NARE T. 上 则 有 8 TR 
然后 , 我 们 再 合并 T 和 T 工 ,等 等 。 下 面 的 图 表 显 示 在 每 趟 合并 之 乒 每 盘 磁 带 上 的 顺 串 的 
个 数 。 


BTR 之 后 之 后 2h 之 后 ¿n ü 之 后 2h 












硕 串 最 馈 的 分 配 有 很 大 的 关系 。 例 如 , 车 2 PME T» E. 12 个 在 T4 FE, 则 第 一 
BATS RSA T, 上 的 12 MCR T; 工 的 10 个 顺 串 。 在 另 一 次 合并 后 ,T+ 上 有 10 
^m ;上 有 2 个 顺 串 。 此 时 ,进展 的 速 讶 慢 了 下 来 . 因为 在 Ts 用 完 之 前 我 们 只 能 合并 
PAM. eT, 有 8 个 顺 串 而 To 有 2 个 顺 串 。 同 样 , 我 们 只 能 合并 两 组 顺 串 ， 结 也 T, 
Ho NARH T; 有 2 个 顺 串 。 再 经 过 三 趟 全 并 之 后 ，T: 还 有 2 个 顺 串 而 其 余 伐 带 均 已 没有 有 
任何 内 容 。 我 们 必须 将 一 个 顺 品 拷贝 到 另外 一 盘 厂 带 上 , 然后 结束 合并 。 

S B. 我 们 络 电 的 最 初 分 配 是 最 优 的 。 姐 果 顺 串 的 个 数 是 一 个 斐 波 那 契 数 Fy, 那么 
分 配 这 些 顺 串 最 好 前 方式 是 把 它们 分 裂 成 两 个 辈 波 那 韶 数 Fx -1 和 Fw .z。 否则 , A DEB 
的 个 数 补足 成 一 个 斐 波 那 契 数 就 必须 用 一 些 哑 顺 串 (dummy run) 来 填补 磁带 。 我 们 把 如 何 将 
一 组 初始 顺 串 分 放 到 役 带 上 的 具体 做 法 留 作 练习 。 

可 以 把 上 面 的 做 法 扩充 到 上 路 合并 , 此 时 我 们 需要 第 上 阶 斐 波 那 契 数 用 于 分 配 顺 串 ， 其 
He 阶 辈 波 那 契 数 定义 为 FDCN) = FÜQN - 1) +t FÜQN - 2) + + FP 
(N — &) AUGE dE FON) = 0, ONE - 2, FO - D be 
7.11.6 替换 选择 

Bose p OE re RU d NR eg pp gas xz 38d 1p, £8 HH B EE REFER m Rf SERE: 该 入 
尽 可 能 多 的 记录 并 将 它们 排序 , FURR EDAD RET, h SUÉGECK SUE nf BERI A EERE, 
二 到 实现 只 要 第 一 个 记录 被 写 到 输出 磁带 上 , 它 所 使 用 的 内 存 就 可 以 被 男 外 的 记录 使 用 。 如 
果 输 入 磁带 上 的 下 一 个 记录 比 我 们 刚刚 输出 的 记录 大 , 那么 它 就 可 以 被 放 人 这 个 顺 吕 中: 

利用 这 种 租 法 ,我 们 可 以 给 出 产生 顺 串 的 一 个 算法 , 该 方法 通常 称 为 普 摘 选择 (replace- 
ment selection)。 开 始 ，M 个 记录 被 读 入 内 存 并 被 放 到 一 个 优先 队列 中 。 我 们 执行 一 次 
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DeleteMin, 把 最 小 的 记录 写 到 输出 磁带 上 , 再 从 输 人 磁带 读 人 下 一 个 记录 。 奶 果 它 比 刚 刚 与 
出 的 记录 大, 那么 我 们 可 以 把 它 加 到 优先 队列 中 , 否则, ARABI ERA BB RS Bu DG 
先 队 列 少 一 个 元 素 , 因此 , 我 们 可 以 把 这 个 新 元 素 存 入 优先 队列 的 死 区 (dead space). TELS 
中 完成 构建 ， 而 该 新 元 秦 用 于 下 一 个 顺 串 。 将 一 个 元 素 存 人 死 区 的 做 法 类 似 于 在 堆 排序 中 的 
做 法 .我 们 继续 这 样 的 步 豫 直 到 优先 队列 的 大小 为 零 , 此 时 该 顺 审 梅 建 完 成 我 们 使 用 死 区 
中 的 所 有 元 素 通 过 建立 一 个 新 的 优先 队列 开始 构建 一 个 新 的 顺 串 。 图 7-18 解释 我 们 正在 使 
MENA TDF HUB AEE, Ap M =3。 CRABS HR. 
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存 这 个 例子 中 , 替换 选择 只 产生 3 MER, 这 与 通过 排序 得 到 5 个 顺 串 不 同 。 正 因为 如 
此 ,3- 路 合并 经 过 一 趟 而 非 两 梢 结束 。 如 果 输 入 数据 是 随机 分 配 的 , 那么 可 以 证 明 替 换 选 择 
产生 平均 长 度 为 2M 的 顺 囊 。 对 于 我 们 所 举 的 大 例子 , 预计 为 160 个 顺 串 而 不 是 320 个 顺 
d. 因此, 5 路 合并 需要 进行 4 未。 在 这 个 例子 中 , 我 们 没有 节省 一 趋 , BRE F 
是 可 以 节省 的 , 我 们 可 能 有 125 或 更 少 的 顺 串 。 由 于 外 部 排序 花费 的 时 间 太 多 , 因此 节省 的 
每 -- 趟 都 可 能 对 运行 时 间 产 生 显 著 的 影响 。 

我 们 已 经 看 到 , 有 可 能 替换 选择 做 得 并 不 比 标准 算法 更 好 。 然 而 ， 输入 数据 常常 从 排序 
或 几乎 从 排序 开始 ,此 时 蔡 换 选择 仅仅 产生 少数 非常 长 的 顺 串 。 这 种 类 型 的 输入 通常 要 进行 
外 部 排序 , 这 就 使 得 替换 选择 具有 特殊 的 价值 : 


总 结 


对 于 最 一 般 的 内 部 排序 应 用 程序 , 选用 的 方法 不 是 插入 排序 、 希 尔 排序 ,就 是 快速 排序 ， 
它们 的 选用 主要 是 根据 输入 的 大 小 来 决定 。 图 7-19 显示 每 个 算法 (在 一 台 相对 较 慢 的 计算 机 
上 ) 处 理 各 种 不 同 大 小 的 文件 时 的 运行 时 间 : 

选择 N 不 整数 组 成 一 些 随 机 排列 ， 而 表 中 给 出 的 各 项 仅仅 是 排序 的 实际 时 间 。 图 7-2 给 
出 的 程序 用 于 插入 排序 。 希 尔 排 序 使 用 7.4 节 中 的 程序 , 该 程序 改 为 使 用 Sedgewick 18 fti 
行 。 基 十 数 以 百 万 计 次 排序 , 大 小 从 100 到 2 500 0000 不 等 , 使 用 这 种 增 量 的 希 尔 排序 预计 
的 运行 时 间 估计 为 OCN4)。 堆 排序 例 程 与 7.5 节 中 的 相同 。 表 中 给 出 两 种 快速 排序 算法 。 
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| RART | 希 东 排序 F 
1 N l 
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| 19 ounnaon NA “1.164 


j| 10 | 0.00044 0 00041 0.000832 1 — .00046 y 
| 100, 0.00675 000171 | 000420 | 0.00284 | — .00244 1 
| mo} 0.59564 0.02927 ! 0.05565 0.03133 j .02587 

H — 10000 | 58.864 042998 | — 0.71650 0.36765 | 31532 | 
, 00000 | NA 3.7298 |! 8.8591 4. wl 3. 2 

! 104,68 47 os | 41.282 m | 
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第 -种 使 用 简单 的 枢纽 元 方法 ， men M FARE, 这 些 输入 文件 是 随机 的 .第 二 种 使 
用 三 数 中 值 分 着 法 , 截止 范围 为 10. ub - 步 的 优化 还 中 有 可 能 的 ， 比 刀 我 们 可 以 与 一 个 内 线 
is HOMBRE ARDS BUT. fetrerpUd 一 个 非 递归 的 快速 排序 .还 存在 其 他 
- - 些 方法 对 代码 进行 优化 ,它们 实现 起 米 相 当 复 杂 , 当然 , 我 们 也 可 使 用 汇编 语言 编程 。 我 
们 已 有 打算 友 效 地 编写 所 有 的 合 程 ,不 过 , 性 能 内 机 器 不 同 当 然 多 少 会 有 些 变 化 

高 度 优化 的 快速 排序 算法 即使 对 于 很 少 的 输入 数据 也 能 和 项 尔 排 序 一 样 快 ， 快 速 排 序 的 
改进 算法 仍然 有 O(N?) 的 最 坏 情 况 ( 有 一 -个 练习 让 你 构造 一 个 小 例子 ), 但 是 , 这 种 最 坏 情形 
出 天 的 机 会 是 如 此 地 微不足道 ， 以 至 于 不 能 成 为 影响 算法 的 因素 。 如 果 需 时 对 一 些 大 型 的 文 
(HERE, 那么 快速 排序 则 是 应 该 选用 的 方法 。 但 是 , 水 远 都 不 要 图 省 事 而 轻易 把 第 -个 元 素 
用 作 枢 钮 元 。 对 输入 数据 随机 的 假设 是 不 安全 的 。 如 果 你 不 模 过 多 地 考虑 这 个 问题 , BATE 
ABARA. A HERA hiki. 不 过 还 是 可 以 接受 的 , 特别 是 需要 简单 明了 的 时 
候 、 希 尔 排序 的 最 坏 情况 也 只 不 过 是 ON) RAREN ALE LBD EB EY 

堆 排 序 要 比 希 尔 排序 慢 ,尽管 它 是 :个 带 有 明显 紧凑 内 循环 的 O(N log N) 算 法， 对 该 
算法 的 深入 考查 揭示 , 为 了 移动 数据 , 堆 排序 要 进行 随 次 比较 。 由 Floyd 提出 的 改进 算法 移 
动 数据 基本 于 只 沉 要 一 次 比较 ,不 过 实现 这 种 改进 算法 使 得 代码 多 少 要 长 一 些 : AXE 
冶 读者 来 决定 这 种 附加 的 编程 代价 用 以 提高 速度 是 否 值 得 (练习 7.40). 

插 人 排序 只 用 在 小 的 或 是 非常 接近 排 好 序 的 输 人 数据 上 。 我们 没有 包括 进来 归并 排序 ， 
因为 它 的 性 能 对 于 主 存 排序 不 如 快速 排序 那么 好 , 而 自 它 的 编程 一 点 也 不 省 事 。 然 而 我 们 已 
经 看 到 , 合并 却 昆 外 部 排序 的 中 心思 想 - 
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7.1 使 用 插入 排序 将 序列 3, 1, 4,1, 5,9, 2, 6, 5 排序. 

212 旭 果 所 有 的 关键 字 都 相等 ,那么 插 人 排序 的 运行 时 间 是 多 少 ? 

7.3 设 我 们 交换 元 素 AL IAAL) + Rl. 它们 最 初 是 无 序 的 . 证 明 去 掉 的 道 序 最 少 为 
1 个 最 多 为 2k - IF, 

7 4 生出 使 用 增 量 }1, 3, 71 对 输入 数据 9, 8, 7, 6，5, 4. 3, 2. 1 运行 希 尔 排序 得 到 的 结果 。 

7.5 a. 使 用 2- 增 量 序列 i1, 2; 的 希 尔 排序 的 运行 时 间 是 多少 
b. 证 明 , 对 任意 的 N, 存在 一 个 3- 增 量 序 列 , 使 得 希 尔 排 序 以 CON ”) 时 则 运行 
c. WE, 对 任意 的 N, 存在 一 个 6- 增 量 序列 , 使 得 希 尔 排 夺 以 CCN EBERT - 

+ 6 xa 证 明 , ADEA L, c, c ooo ec 的 增 量 , 希 尔 排序 的 运行 时 间 为 AON), 其 

H, c 为 任 一 整数 。 





* *b. 证 明 , 对 于 这 些 增 量 , 平均 运行 时 间 为 (N77). 


«7.7. 证 明 , 若 一 个 排序 的 文件 而 后 被 A 排序, 则 它 仍 是 排序 的 。 

x «7,8. 证 明 , 使 用 由 Hibbard 建议 的 增 量 序列 的 希 尔 排 序 在 最 坏 情 形 下 的 运行 时 间 是 
O(N?) ,提示 : 可 以 证 明 当 所 有 的 元 素 不 是 0 就 是 1 时 希 尔 排序 这 种 特殊 情形 C57 
的 时 间 界 。 如 果 i; 可 以 表 为 有, hy a, s. Alege 1 的 线性 组 合 , 则 可 置 Input- 

Data[ i] = 1, 否则 置 为 0。 
7.9 “确定 希 尔 排 序 对 于 下 述 输入 的 运行 时 间 ; 


7.1 
7.12 


7.13 


7.14 
7.15 


7.16 


7.17 
7.18 


7.19 


7.20 


本 
c molt 


a， 排 过 序 的 输入 数据 
*b. 反 序 排列 的 输入 数据 
下 述 两 种 对 图 7-4 所 编写 的 希 尔 排 序 例 程 的 修改 影响 最 坏 情 形 的 运行 时 间 坦 ? 
a. "5 Increment 是 侦 数 ， 则 在 第 2 行 前 从 Increment 减 1。 
b. 如 果 Increment 是 偶数 , 则 在 第 2 行 前 往 Increment 加 1。 
指出 堆 排 序 如 何 处 理 输 入 数据 142, 543, 123, 65, 453, 879, 572, 434, 111, 242, 811, 102. 
a. 对 于 预 排序 的 输入 数据 , 堆 排 序 的 运行 时 间 是 多 少 ? 


"b. 证 明 , 堆 排 序 的 最 坏 情 形 的 界 是 可 以 达到 的 。 


用 扫 并 排序 将 3, 1, 4, 1, 5, 9, 2, 6 排序 ， 

不 使 用 递归 如 何 实 现 归并 排序 ? 

懈 定 对 下 列 数据 进行 归并 排序 的 运行 时 间 : 

a. 排 过 序 的 输入 数据 

b. 反 序 排列 的 输入 数据 

c. 随机 的 输入 数据 

在 归并 排序 的 分 析 中 是 不 考虑 常数 的 。 证 明 , 归并 排序 在 最 坏 情形 下 用 于 比较 的 
次 数 为 N[jog N] 一 25595 1. 

用 三 数 中 值 分 割 法 以 及 截止 为 3 的 快速 排序 将 3,，1, 4, 1, 5, 9, 2, 6, 5, 3, 5 HEP, 
使 用 本 章 中 的 快速 排序 实现 方法 确定 下 列 输入 数据 的 快速 排序 运行 时 间 :; 

a. 排 过 序 的 输入 数据 

b. 反 序 排列 的 输入 数据 

c. 随机 的 输入 数据 

当 枢 纽 元 被 选 作 下 询 元 素 时 重复 练 寺 7. 18: 

a. 第 一 个 元 素 

b. 前 两 个 互 异 关键 字 中 的 最 大 者 

一 个 随机 元 素 

在 该 输入 集合 中 所 有 关键 字 的 平均 值 

对 于 本 音 中 快速 排序 的 实现 方法 ， 当 所 有 的 关键 字 都 相等 时 它 的 运行 时 间 是 多 少 ? 

.假设 我 们 改变 分 割 策 略 使 得 当 找到 一 个 与 枢纽 元 相同 的 关键 字 时 i 和 j 部 不 
停止 。 当 所 有 的 关键 字 都 相等 时 ， 为 了 保证 快速 排序 正常 工作 ,需要 对 程序 做 
哪些 修改 ”运行 时 间 是 多 少 ? 558] 

c 假设 我 们 改变 分 割 策 略 使 得 在 ~…. 个 与 枢纽 元 相同 的 关键 字 处 i 停止, 但 是 7 

在 类 似 的 情形 下 却 不 停止 。 为 了 保证 快速 排序 正常 工作 , 需要 对 程序 做 哪些 
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7.29 


7.36 


fg 当 所 有 的 关键 学 都 相等 时 , 快速 排序 的 运行 时 间 是 多 少 ? 
妈 我 们 选择 中 国 的 关键 字 作 为 桃 纽 汇 。 这 是 否 使 得 快速 排序 将 不 可 能 击 要 二 次 时 间 ? 
构造 刃 个 元 素 的 一 个 排列 使 得 对 于 := 数 中 人 才 分 当 旧 截止 为 BSR, PBS ny ee, 
编写 一 个 程 厅 实现 选择 算法 ， 
求解 下 列 递 推 关系 ;: TUN) = (1AN)[2) TOD] + oN, TO) = 0. 
如 果 一 切 具 有 相等 关键 字 的 元 率 孝 保持 它们 在 输 人 数据 时 呈现 的 顺序 , 那么 这 种 排 
序 算 法 就 是 稳定 的 {stable}。 本 章 中 的 排序 算法 哪些 是 稳定 的 ? 哪些 不 是 ?为 1 io 
设 给 定 ON THESE ACE, GRA 六 NI) 个 随机 顺序 的 元 素 。 AUR SON) 
列 情 况 ， 那么 如 何 将 全 部 数据 排序 ? 
a. f(N) = O(1)7 
b. FON) = O(log N)? 
c. f(N) = O(/ N)? 
"d. FON) E KTEIS 4 BB S EA BERELA O(N ) 时 间 排 序 ” 
证 明 ; 在 N 个 元 素 排 过 序 的 表 中 找 出 一 个 元 素 X 的 任何 算法 都 需要 Ndg NRA 
利用 Stirling 公式 N! (N/Ve)N v2xN 给 出 log (NN1) 的 精确 估计 。 
*a. 两 个 排 过 序 的 NN 个 元 素 的 数组 有 多 少 种 合并 的 方法 ? 
*b, 给 出 合并 两 个 N 个 元 素 的 排 过 序 的 数组 所 天 要 的 比较 次 数 的 非 平 几 下 沉 ， 
证 明 , 使 用 桶 式 排序 把 具有 范围 在 LES bey M 内 的 整数 关键 宁 的 NN 个 元 素 排 序 
需要 时 间 OLM + N): 
BAN 个 元 素 的 数组 只 包含 两 个 不 同 的 关键 字 trae 和 false。 给 出 :个 ODN) 算 
法 , 重新 排列 这 些 元 素 使 得 所 有 false 的 元 素 都 排 在 true 的 元 素 的 前 面 ， 你 只 能 
使 用 常数 附加 空间 。 
设 有 N 个 元 素 的 数组 包含 三 个 不 同 的 关键 宁 true, false 和 maybe. 给 出 一 个 O 
(MER, 重新 排列 这 些 元 素 , 使 得 所 有 false 的 元 系 都 排 在 maybe RAMA, 
而 maybe ILA ARTE true 元 素 的 前 面 。 你 只 能 使 用 常数 附加 空间 。 
a. WHA, 任何 基于 比较 的 算法 将 4 个 元 素 排序 均 害 $5 次 比较 。 
b. 给 出 一 种 算法 用 5 次 比较 将 4 个 元 素 排序 。 
a. 证 明 ; 使 用 任何 基于 比较 的 算法 将 5 个 无 素 排序 都 需要 7 次 比较 。 


“和 给 出 一 个 算法 用 7 次 比较 将 5 个 元 素 排 序 。 


写 出 一 个 有 效 的 希 尔 排序 算法 并 比较 当 使 用 下 列 增 基 序列 时 的 性 能 : 
a. 希 尔 的 原始 序列 
b. Hibbard 的 增 量 


c. Knuth 的 增 量 : k= 方 (3 + 1) 





d. Gonnet 的 增 量 : h =l SJ ii h 一 上 262 Cg A47 20] A= 1) 

e. Sedgewick 1# Œ 

实现 优化 的 快速 排序 算法 并 用 下 列 组 合 进 行 实 验 : 

a. 枢纽 元 ; 第 一 个 元 素 , 中 间 的 元 素 , 随机 的 元 素 ， 三 数 中 值 , 五 数 中 值 。 


T5 


b. 截止 值 从 0 到 20: 
7.37 编写 一 个 例 程 读 人 两 个 用 字母 表示 的 文件 并 将 它们 合并 到 一 起 , 形成 第 三 个 也 是 
HFE RERI IE. 
7 38 ” 设 我 们 实现 二 数 中 值 例 程 如 下 : 找 出 AL Left], Al Center) A A[ Righe btia, 
HEE S AL Rihi 交换 .以 通常 的 分 荐 方法 进行 , 开始 时 ;在 Left 处 且 ) 在 
Right 一 1 处 {而 不 是 Left + 1 和 Right — 2). 
a. 设 输入 为 2, 3, 4,...,，N - V, N, 1。 对 于 沪 输 入 , 这 种 快速 排序 算法 的 运 
AT AY fal Fb p? 
b. idi ARES RAPES OFA, 这 种 快速 排序 算法 的 运行 时 间 又 证 多 少 ” 
7.39 证 明 : 任何 基于 比较 的 排序 算法 前 需要 平均 O Niog N) 次 比较 。 
7.40 "EHE FIBI) PercolateDown 算法 。 我 们 在 节点 苇 有 一 个 空 六 (hole). 普通 的 例 程 是 比 
较 X 的 儿子 然后 把 比 我 们 将 要 放置 的 元 素 大 的 儿子 上 移 到 针 处 (在 (mar) 堆 的 情形 
T). 中 此 将 空 穴 下 推 ; 当 把 新 元 来 安全 让 到 室 闪 中 时 我 们 终 目 算法。 用 一 种 方法 是 
将 元 素 上 移 且 空 穴 尽 可 能 地 下 移 ,， 不 用 测试 是 否 能 够 插入 到 新 单元 - 这 将 使 得 新 单 
元 被 放置 到 一 片 树叶 上 并 可 能 破坏 堆 序 ; 为了 修复 堆 序 ,以 通常 的 方式 将 新 单 才 上 
滤 。 写 出 包含 该 想法 的 例 程 ,并 与 标准 的 玲 排 序 实 现 方法 的 运行 时 间 进 行 比较 
7.41 提 岂 一 种 算法 ,只 用 两 盘 磁 带 对 一 个 大 型 文件 进行 排序 : 
7.42 a. 道 过 建 堆 (build-heap)} 最 多 使 用 2N c MSR SR SC HE HELME RN! 7 
2-… , 
b. 利用 Stirling 公式 扩展 该 界 . 
7.43 ANSI C 要 求 例 程 gsort 出 现在 C 函数 库 中 ，qsort 由 快速 排序 典型 算法 实现 (但 这 
不 是 必须 的 )， 通 过 备 种 输入 数据 进行 实验 观察 是 否 asort 能 够 出 现 二 次 的 特性 . 
用 一 些 随机 的 0 和 1 测试 。 
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决策 树 和 排序 优化 在 Ford fl Johnson 3] Pie. 这 篇 论文 还 提供 了 一 个 算法 , 它 儿 乎 符合 


用 比较 (而 不 是 其 他 操作 ) 次 数 表 未 的 上 下界。 该 算法 最 后 由 Manacher 12 | 指出 稍 阳 于 最 优 。 


外 部 排序 及 其 细节 涵盖 于 |11].. 在 练习 7.25 中 描述 的 稳定 排序 算法 已 由 Horvath[81 提 出 . 
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第 8 章 不 相交 集 ADT 


在 这 一 章 , 我 们 描述 解决 等 价 问题 的 一 种 有 效 数 据 结构 。 这 种 数据 结构 实现 起 来 简单 ， 
每 个 例 程 只 央 要 几 行 代码 , 闪 且 可 以 使 用 一 个 简单 的 数组 。 它 的 实现 也 非常 地 快 , 每 种 操作 
只 需要 前 数 平 均 时 间 。 从 理论 上 看 , 这 和 神 数 据 结构 还 是 非常 有 趣 的 ,内 为 它 的 分 析 极 其 朵 
XE. 最 坏 情 况 的 函数 形式 不 同 于 我 们 已 经 见 过 的 任何 形式 、 对 于 这 种 不 相交 集 ADT, 我 们 将 

© 讨论 如 何 能 够 以 最 少 的 编程 代价 实现 ， 

e 通过 两 个 简单 的 观察 极 大 地 增加 它 的 速度 。 

e 分 析 一 种 快速 的 实现 方法 的 运行 时 间 . 

e 介绍 一 个 简单 的 应 用 . 


8.1 等 价 关系 


车 对 于 每 一 对 元 素 (a ,5), a, bE S, aRb 或 者 为 true 或 者 为 false， 则 称 在 集合 S LE 
XX Alrelation) R. 4È aRb 是 true, 那么 我 们 说 a 55 XX. 

4 4fr & & (equivalence relation) 是 满足 下 列 二 个 性 质 的 关系 R: 

I. CE RIED T PTS II a€ S, aRa. 

2.( 对 称 性 yaRp SAIL bRa 

3 传递 性 } 若 aRb 旦 5Rc 则 aRe。 

我 们 将 考虑 几 个 例子 : 

关系 “所 ”不 是 等 价 关 系 。 虽然 它 是 自 反 的 ( 即 axa), 可 传递 的 ( 即 由 asco 和 5 所 < 得 
Baze), 但 它 却 不 是 对 称 的 , 因为 从 es 并 不 能 得 出 se 。 

电气 连通 性 (electrical connectivity) 是 -一 个 等 价 关 系 ， 其 中 所 有 的 连接 都 是 通过 金属 导线 
完成 的 。 该 关系 显然 是 自 反 的 , 因为 任何 元 件 都 是 白 身 相连 的 。 如 果 a BAERS, 那么 
5 必然 了 由 电气 连接 到 a。 最 后 ,如果 a 连接 到 5, 而 五 又 连接 到 c, 那么 a 连接 到 <。 因 此 , 电 
气 连接 是 一 个 等 价 关 系 。 

如 果 两 个 城市 位 于 同一 个 国家 , 那么 定义 它们 是 有 关系 的 。 容 易 验 证 这 是 一 个 等 价 关 
系 。 如 果 能 够 通过 从 路 从 城镇 a TED, MHE a 与 5 有 关系 如果 所 有 的 道路 都 是 双 疝 行 
驶 的 . 于 么 这 种 关系 也 是 一 个 等 价 关 系 ， 

8.2 动态 等 价 性 问题 

给 定 -- 个 等 价 关 系 “~”, 一 个 白 然 的 问题 是 对 任意 的 a Mo, REER aco. WAR 
等 价 关系 存储 为 一 个 二 维 布尔 数组 ， 那 么 当然 这 个 工作 可 以 以 常数 时 间 完成 。 问 题 在 于 , 这 
种 关系 的 定义 通常 不 明显 而 是 相当 隐秘 。 

作为 一 个 例子 , 设 在 5 个 元 素 的 集合 jai，az，a3，a4，ea51 上 定义 一 个 等 价 关 系 。 此 时 
Ak 25 对 元 素 , 它们 的 每 一 对 或 者 有 关系 或 者 没有 关系 。 然而, fe aS a2, 037 a4, 
as~ aj, ay es 意味 着 每 一 对 元 素 都 是 有 关系 的 。 我 们 希望 能 够 迅速 推 斯 出 这 些 关 系 。 

一 个 苞 素 aC S HF tt & (equivalence clas) i S 的 一 个 子 集 , CHAM a 有 关系 的 


Es 
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Ju HER, 等 价 类 形成 对 S 的 一 个 划分 : SHARP RARER T SERAIS HU A 
EER a 一 5, 我们 内需 验证 a Ab 基 舍 部 在 同一 个 等 价 类 中 。 这 给 我 们 提供 了 解决 等 价 问 
SES E. 

输入 数据 最 初 是 N DRAW (collection), 每 个 集合 含有 一 个 元 类。 初始 的 描述 是 所 有 
的 关系 均 为 false( 自 反 的 关系 除外 )。 每 个 集合 都 有 一 个 不 同 的 元 素 , 从 而 SAS = 0: 这 使 
[PAER S THA (disjoint), 

此 时 , 有 两 种 运算 允许 进行 。 第 一 种 运算 是 Find, 它 返 四 包含 给 定 元 素 的 集合 ( 即 等 价 
类 ) 的 和 名字。 第 二 种 运算 是 添加 关系 ,， 如 果 我 们 想 要 添 而 关系 a ~ b, WARME EHAE 
Ta 和 5 已 经 有 关系 ， 这 可 以 通过 对 a Mo 执行 Find 并 检验 它们 基 否 在 同一 个 等 价 炎 中 来 
ZR. WRENNER AB, 那么 我 们 使 用 求 并 运算 Union, 这 种 运算 把 富有 4a 和 的 两 
个 等 价 类 合并 成 一 个 新 的 等 价 类 。 从 集合 的 观点 来 看 ，U 的 结果 是 建立 一 个 新 集 从 Si 一 S 
US. 去 掉 原 来 两 个 集合 而 保持 所 有 的 集合 的 不 相安 性 ， 由 于 这 个 原因 ,常常 把 做 这 项 工作 
的 算法 叫做 不 相交 集合 的 Cnion/Find JE; ; 

该 算法 是 动态 的 (dynamic), 内 为 在 算法 执行 的 过 程 中 ， 集合 可 以 通过 Union SA MAE 
改变 ， 这 个 算法 还 必然 是 联机 {on-line) 操 作 :; 当 Find 执行 时 , 它 必 须 给 出 答案 算法 才能 继 乡 
进行 。 另 一 种 可 能 是 脱 机 (off-line) 算 法 ,该 算法 需要 观察 全 部 的 Union 和 Find RR. ER 
个 Find 给 出 的 答案 必须 和 所 有 执行 到 该 Find 的 Union 一 致 ， 而 该 算法 在 看 到 所 有 的 问题 以 
后 再 给 出 它 的 所 有 的 答案 。 这 种 差别 类 似 于 参加 一 次 笔试 ( 它 一 般 是 脱 机 的 一 一 你 只 能 在 规 
定 的 时 疗 用 完 之 前 给 叶 答 卷 ) 和 一 次 口试 ( 它 基 联机 的 ， 因为 你 必须 问答 当前 的 问题 , 然后 才 
能 继续 下 一 个 问题 )， 

注意 , 我 们 不 进行 任何 比较 元 素 相 关 的 值 的 操作 , 而 是 只 宕 要 知道 它们 的 位 置 。 由 于 这 
个 原因 ,我们 假设 所 有 的 元 素 均 已 从 1 到 N 顺序 编导 并 且 编 号 方法 容易 由 某 个 若 列 方案 确 
E. TE, 开始 时 我 们 有 S= ;ij ,i=1 到 NN。 

我 们 的 第 二 个 观察 是 , 由 Find 返回 的 集合 的 各 字 实 际 上 是 柑 当 任意 的 。 真 正 重 要 的 大 
RETF: Find(a) = Find HHAH a Hib 在 同一 个 集合 中 。 

这 些 运 算 在 许多 图 论 问题 中 是 重要 的 ,在 一 些 处理 等 价 (或 类 型 ) 声 明 的 编译 程序 中 也 很 
重要 ， 我 们 将 在 后 面 讨论 一 个 应 用 。 

解决 动态 等 价 问题 的 方案 有 两 种 。 一 种 方案 保证 指令 Find 能 够 以 常数 最 坏 情形 运行 时 
间 拱 行 ， 而 另 一 种 方案 则 保证 指令 Union 能 够 以 常数 最 坏 情形 运行 时 间 执 行 。 最 近 有 人 指出 
二 者 不 能 同时 做 到 : 

我 们 将 简要 讨论 第 一 种 处 理 方 法 。 为 使 Find 和 运算 快 ， 可 以 在 一 个 数组 中 保存 每 个 无 素 
的 等 价 类 的 名 字 。 此 时 ,Find 就 是 简单 的 O(1) 和 查找 。 设 我 们 想 要 执行 Uniola. b), Fit a 
在 等 价 类 i 中 而 5 在 等 价 类 ; 中 。 然 后 我 们 扫描 该 数组 , 将 所 有 的 i 改变 成 }。 不 过 ,这 次 扫 
措 更 花费 (CN) 时间。 于 是 , 连续 N 一 1 次 Union 操作 (这 是 最 大 值 , 内 为 此 时 每 个 元 素 部 
在 一 个 集合 中 ) 就 要 花费 O(N RU. MRE QUN? IX, Find 运算 ,那么 性 能 会 很 好 ， 
因为 在 整个 算法 进行 过 程 中 每 个 Find 或 Union 运算 的 总 的 运行 时 间 为 OC. HIA Find is 
算 没 有 那么 多 , 那么 这 个 界 是 不 可 接受 的 ; 

种 想法 是 将 所 有 在 同一 个 等 价 类 中 的 元 素 放 到 一 个 链表 中 。 这 在 更 新 的 时 候 会 节省 时 
间 ， 因 为 我 们 不 必 搜 索 整 个 数组 : 但 昆 由 于 它 在 算法 过 程 中 仍然 可 能 执行 ON UAE OTH 
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的 更 新 , 因此 它 本 了 本 并 不 能 单独 减少 痢 进 运行 时 间 

姐 昌 我 们 还 要 蹊 踪 每 个 等 俐 类 的 大 小 , 并 在 执行 Union 时 将 较 小 的 等 价 类 的 名字 改 成 较 
大 的 等 价 类 的 名 字 , 那么 对 于 N ~ 1 次 合并 的 总 的 时 间 开 销 为 OCN log ND; HEA AT. 
每 个 元 素 可 能 将 它 的 等 价 类 最 多 改变 log NK, 因为 每 次 它 的 等 价 类 改变 时 它 的 新 的 等 独 类 
至 少 是 它 的 原来 等 恒 类 的 两 倍 大 。 使 用 这 种 方 沪 , 任意 顺序 的 M 次 Find 和 直到 NN 一 1 次 
的 Union RAER OCM + N log N) 时 间 。 

在 本 章 的 其 余部 分 , 我 们 将 考查 Union/Find IA A — ARTE, 其 中 Union xd RA B 
Find 运算 贤 难 一 些 。 即 使 如 此 , 任意 顺序 的 最 多 M 次 Find 和 直到 N - 1% Union 的 运行 
时 间 将 只 比 O(M + NT) 多 一 点 。 


8.3 基本 数据 结构 


E, 我 们 的 问题 不 要 求 Find 操作 返回 任何 特定 的 名 宁 , 而 只 是 要 求 当 且 仅 当下 个 元 素 
属于 相同 的 集合 时 ， 作 用 在 这 两 个 元 素 上 的 Find 返回 相同 的 名 字 。- -种 想法 是 可 以 使 用 树 
来 表示 每 一 个 集合 ， 因 为 树 上 的 每 一 个 元 素 都 有 相同 的 根 。 这 样 ， 该 恨 就 可 以 用 来 命名 所 在 
的 集合 。 我 们 将 用 树 表 示 每 一 个 集合 。{ 记 住 , 树 的 集合 叫做 森林) 此 好 时 每 个 集合 含有 一 
个 元 素 。 我 们 将 要 使 用 的 这 些 树 不 一 定 必须 是 二 丸 树 , 但 是 表示 它们 要 容易 , BARN 
的 惟一 信息 就 是 一 个 父 指针 。 集合 的 名 字 由 根 处 的 节点 给 出 。 由 于 只 需要 父 节点 的 名 字 ， 因 
此 我 们 可 以 假设 树 被 非 显 式 地 存储 在 一 个 数组 中 : 数组 的 每 个 成 员 PL i 表示 元 素 i 的 父 杀 。 
如 果 ; ER, 那么 PEi] = 0。 在 图 8-1 的 森林 中 , 对 于 1 所 i 去 8, P[;] = 0。 止 如 在 堆 中 闭 
样 .我 们 也 将 显 式 地 画 出 这 些 树 , 注意 , 此 时 正在 使 用 一 个 数组 。 图 8-1 表达 了 这 种 显 式 的 
表示 方法 ,为 方便 起 见 , 我 们 将 把 根 的 父 指 针 垂 可 男 出 。 


SOOOOOOO 


图 8.1 八 个 元 素 , 最 初 是 在 不 同 的 集合 上 


YT PUT MEAD Union 运算 , 我 们 使 一 个 节点 的 根 指针 指向 另 - - 棵 树 的 根 节点 。 显 
Ro 这 种 操作 花费 常数 时 间 。 图 8-2、8-3 和 8-4 分 别 表示 在 Union(5, 6). Union(7, 8) 
Union(5, 7) 后 的 森林 ,， 其中, 我们 采纳 了 在 Union X, Y) 后 新 的 根 是 X MAS. RAN FE 
林 的 非 显 式 表 示 见 图 8-5。 


DODOA OF 


图 82 dE Union(5, 6) 之 后 


RE X BU Find(X) 操 作 通过 返回 包含 X 的 树 的 根 而 完成 。 执 行 这 次 操作 花费 的 
Ms sm X 的 节点 的 深度 成 正比 ,当然 这 要 假设 我 们 以 常数 时 间 找 到 表示 X 的 和 节点。 使 
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图 83 JF Lnion(7, $3) 之 后 


ILI 


图 上 4 dE Union(5, DZE 
PP Pl ls]] 
1 2 3 4 5 6 7 8 
图 85 .上面 的 树 的 韭 显 式 表 示 


用 上 面 的 方法 , 能 够 建立 - 棵 深度 为 N — 1 的 树 , 使 得 一 次 Find 的 最 坏 情 形 运行 时 则 是 
O(N), 一 般 情况 , 运行 时 间 是 对 连续 泥 合 使 用 M 个 指令 来 计算 的 。 在 这 种 情况 下 ，M URE 
续 操 作 在 最 坏 情 形 下 可 能 花费 ONWN) 时 间 : 

el 8.6 到 图 8-9 中 的 程序 表示 基本 算法 的 实现 , 假设 差错 检验 已 经 执行 。 在 我 们 的 例 程 
ch. 这 些 Union 是 在 这 些 树 的 根 上 进行 的 。 有 了 时候 运算 是 通过 任意 两 个 元 素 进 行 , 并 使 得 
Union 执 行 两 次 Find 以 确定 这 些 根 。 


#ifndef | DisjSet H 


typedef int DisjSet[ NumSets + 1 ]; 
typedaf int SetType; 
typedef int ElementType; 


void Initilializet DisjSet 5 5; 
void SetUnion( DisjSet 5, SetType Rootl, SetType Root2 3; 
SetType Find( ElementType X, DisjSet 5 2; 


endif /* DisjSet_H */ 





图 8-6 不 相交 集合 的 类 型 声明 


平均 时 间 分 析 是 相当 困难 的 。 最 起 三 的 问题 是 党 案 依赖 于 如 何 定义 (对 Union 操作 而 言 
26) 的 ) 平 均 。 例 如, 在 图 8.4 的 琳 林 中 ,我 们 可 以 说 , 由 于 有 SHUT, 因此 下 一 个 Union 就 存在 
l| 5-4 = 20 个 等 可 能 的 结果 (因为 任意 两 村 不同 的 柑 都 可 能 被 Union)。 当 然 ， 这 个 模型 的 全 


义 在 十 ,只 存在 专 的 机 会 使 得 下 一 次 Union 小 及 到 大 树 。 另 一 种 贷 型 可能 会 认为 在 不 同 的 权 


Initialize( DisjSet 5) 
{ 


int 3; 


for( i = NumSets: 1 > D; i-- 3 
s[ i] = 0; 





图 8-7 不 相交 集合 的 初始 化 例 程 


/* Assumes Rootl and Root? are roots */ 
/* woion is 4 C keyword, so this routine */ 
/* 18 named SetUnion */ 


void 
Setunian( DisiSet 5, SetType Rootl, SetType Root? ) 


S[ Root? ] = Rootl; 





图 88 Union( 不 是 最 好 的 方法 ) 














SetType 
Find( ElementType X, DisjSet S > 


if SEX 1 <0) 
return X; 


else 
return Finde SF X 1, 5 3: 


图 8-9 一 个 简单 不 相交 集合 Find 算法 


上 任意 两 个 元 素 间 的 所 有 Union 都 是 等 可 能 的 ， 因 此 大 树 比 小 树 更 有 可 能 在 下 一 次 Union 中 
OME LIE, 有 号 的 机 会 大 树 在 下 一 次 Union 中 会 被 涉及 到 ， 因 为 (忽略 对 称 
性 ) 存 在 6 种 方法 合并 11, 2, 3, A PRATELA 16 种 方法 将 15，6，7， SEPA TOUE 
Sil, 2, 3, 4} 中 的 一 个 元 素 合并 。 还 存在 更 多 的 模型 ,而 在 何者 为 最 好 的 问题 上 没有 一般 
的 一 致 见解 。 平 均 运行 时 间 依赖 于 模型 ; 对 于 三 种 不 同 的 模型 , 时 间 界 9(M), OCM log N) 
以 及 日 ( MN) 实际 上 已 经 证 明 , 不 过 , 最 后 的 那个 界 重 现实 坚 。 

对 一 系列 操作 的 二 次 (quadratic) 运 行 时 间 一 般 是 不 可 接受 的 。 可 幸 的 是 ， 有 几 种 方法 容 
易 保证 这 样 的 运行 时 间 不 会 出 现 。 
8.4 灵巧 求 并 算法 | 

ETA Union 的 执行 是 相当 任意 的 ， 它 通过 使 第 二 棵 树 成 为 第 一 称 央 的 子 树 而 完成 台 
并 。 对 其 进行 简单 改进 是 借助 任意 的 方法 打破 现 有 关系 ,使得 总 让 较 小 的 树 成 为 较 大 的 树 的 
子 树 ; 我 们 把 这 种 方法 叫 微 按 大 小 求 并 (union-by-size)。 前 面 例子 中 三 次 Union 的 对 象 大 小 
都 是 一 样 的 , 因此 我 们 可 以 认为 它们 都 是 按照 大 小 执行 的 。 假 如 下 一 次 运算 是 Union(4, 5), 
那么 结果 将 形成 图 8-10 中 的 森林 。 倘 若 没有 对 大 小 进行 探测 而 直接 Union, 那么 结果 将 会 形 








上 成 更 深 的 树 ( 图 8-11) - 


5d 5 


0 (OC 


图 8-10 按 太 小 求 并 的 结果 


ORORO wu 


图 8-11 进行 一 次 任意 的 并 的 结果 


我 们 可 以 证 明 ， 如 果 这 些 Union 都 是 按照 大 小 进行 的 , 那么 任何 节点 的 深度 均 不 会 超过 
log Nok, 首先 注意 节点 初始 处 于 深度 0 的 你 置 。 当 它 的 深度 随 痢 一 次 Union KA A mis 
加 的 时 候 , 该 节点 则 被 置 于 至 少 是 它 以 前 所 在 树 两 倍 大 的 一 棵 树 上 。 因 此 , 它 的 深度 最 多 可 
以 增加 log N 次 。( 我 们 在 8.2 和 节 末 尾 的 快速 查找 算法 中 用 过 这 个 论断 , ROR IRA, Find te 
作 的 运行 时 间 是 O(log N), 而 连续 M 次 操作 则 花费 口 (M log N)。 图 8-12 中 的 树 指 出 在 
16 次 Union 后 有 可 能 得 到 这 种 最 坏 的 树 , 而 旦 如 果 所 有 的 Union ABATE AC OBE, WB 
么 这 样 的 树 是 会 得 到 的 (最 坏 情形 的 树 是 在 第 6 童 讨论 过 的 二 项 树 )。 





图 8-12 N = 16 时 最 坏 情 形 的 树 


为 了 实现 这 种 方法 ,我们 需要 记 住 每 一 棵 树 的 大 小 。 由 于 我 们 实际 上 只 使 用 一 个 数组 ， 
因此 吕 以 让 每 个 根 的 数组 元 素 包含 它 的 树 的 大 小 的 负 值 。 这 样 一 来 , 初始 时 树 的 数组 表示 就 
都 是 -~ 1 了 (而 图 8-7 则 需要 进行 相应 的 改变 )。 当 执行 一 次 Union 时 , 要 检查 树 的 大 小 ; 新 
的 大 小 是 老 的 大 小 的 和 。 BORE, 按 大 小 求 并 的 实现 根本 不 存在 困难 , 并 且 不 需要 额外 的 空 
hp. 其 速度 平均 也 很 快 。 对 于 真正 所 有 合理 的 模型 .业已 证 明 , 若 使 用 按 大 小 求 并 则 连续 M 





次 运算 需要 O 〇 CAD) 平均 时 间 。 这 是 因为 当 随机 的 诸 Union 热 行 时 整个 算法 一 般 只 有 一 些 很 小 
的 集合 ( 通 肖 含 一 个 元 索 ) 与 大 集合 合并 ， 

另外 一 神 实 现 方法 为 按 高 度 求 并 (union-by-height)， 它 同样 保证 所 有 的 树 的 深度 最 多 是 
Otlog NJ. 我 们 跟踪 每 棵 树 的 高 度 而 不 是 大 小 并 执行 那些 Union 使 得 浅 的 树 成 为 深 的 树 的 
子 树 。 这 是 一 种 平缓 的 算法 ,因为 只 有 妆 两 棵 相等 深度 的 树 求 并 时 树 的 高 度 才 增加 (此 时 树 
的 高 度 增 1)。 这 样 , 按 高 度 求 并 是 按 大 小 求 并 的 简单 修改 。 

下 列 各 图 显示 一 棵 树 以 及 它 对 于 按 大 小 求 并 和 按 高 度 求 并 的 非 显 式 表 和 示 。 图 8-13 中 的 
程序 实现 的 是 按 高 度 求 并 的 代 三 ， 


OO 








/* Assume Rootl and Root? are roots */ 
/* union is a C keyword, so this routine */ 
/* is named SetUnion */ 


void 
SetUniont DisjSet $, SetType Rootl, SetType Root2 ) 
{ 


if€ SE Rootz ] < SE Rootl 1 ] /* Raot2 is deeper set “y 
; SE Rootl ] = Root2; /* Make Root? new root */ 
i else 


ift SE Root] ] == SE Root2 ] ) /* Same height, ui i 
5[ Rootl J--; /* 50 update */ | 


S[ Root? ] = Rootl; 
' | 





图 8-13 按 高 度 ( 秩 ) 求 并 的 程序 


8.5 路 径 压 缩 


15^ BHÉXEBS Union/Find 算法 对 于 大 多 数 的 情形 都 是 完全 可 接受 的 ， 它 是 非常 简单 的 ， 
而 日 对 于 连续 M 个 指令 (在 所 有 的 模型 下 ) 平 均 是 线性 的 。 不过, OCM log N) 的 最 坏 情况 还 
是 可 能 相当 容易 并 自然 地 发 生 的 。 例 如 ， 如 果 我 们 把 所 有 的 集合 放 到 一 个 队列 中 并 重复 地 证 
前 两 个 集合 出 队 而 让 它们 的 并 入 队 ， 那么 最 坏 的 情况 就 会 发 生 。 WEB Find 比 Union # 
Ws. 都 么 其 送行 时 间 就 比 快速 查找 算法 的 运行 时 间 要 粳 ， 而 用 应 该 清楚 ,对 于 Union 算法 
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tegi Be EY] RE. RE PIE; 执行 Union 操作 的 任何 算法 都 将 产生 相同 
的 最 坏 情 形 的 树 ,， 因 为 它 必 然 会 随意 打破 树 阅 的 均衡 。 因 此 ， 无 须 对 整个 烽 搞 结 梅 重 新 加 荆 
而 使 算法 如 速 的 惟一 方法 是 对 Find 操作 做 些 更 聪明 的 工作 。 

这 种 聪明 的 操作 间 做 路 径 压 缩 (path compression)。 路 径 压 缩 在 一 次 Find 操作 期 间 执 行 
而 与 用 来 执行 Union 的 方法 无 关 。 设 操作 为 Find(CX)， 此 时 路 径 压 缩 的 效果 是 ,从 X SA 
路 径 上 的 每 一 个 节点 部 使 它 的 父 节点 变 成 根 。 图 8-14 指出 在 对 图 8-12 的 最 坏 的 树 执行 Find 
CLS) Ja ESSE TE BR 





图 8-14 PETSPEBABS— TP 


He 45 Ag a Sc ET GE FS) A138 和 14 现在 离 根 近 了 一 个 位 鉴 ， 
而 节点 15 和 16 现在 离 根 近 了 两 个 位 置 。 因 此 ,对 这 些 节 点 末 来 的 快速 存 取 将 付出 (我 们 项 
望 } 额 外 的 工作 来 进行 路 径 压 缩 。 | 

主 如 图 8-15 中 的 程序 所 指出 的 , BEERTA EA Find 操作 收 变 不 大 。 对 Find 例 程 来 
涝 ,惟一 的 恋 化 是 使 得 SLX] 等 于 由 Find 返回 的 值 ; RH, 在 集合 的 根 被 递归 地 找到 以 厂 ， 
X 就 十 接 指 向 它 。 对 通 向 根 的 路 径 上 的 每 一 个 节点 这 将 递归 地 出 现 ,因此 实现 了 路 征 上 小 次 。 





SetType 
Find( ElementType X, DisiSet 3 jJ 


if( 5[ X 1] <= 0 2 
return X; 
else 
return SE X 1 = Find( SL X 1, 5); 


图 8-15 用 路 径 乓 缩 进行 不 相交 集 Find 的 程序 


当 任 意 执行 一 些 Union 操作 的 时 候 , 路 径 压 英 是 一 个 好 的 想法 ， 因 为 存在 许多 的 深层 六 
点 并 通过 路 径 压 缩 将 它们 移 近 根 节 点 。 业 已 证 明 , 当 在 这 种 情况 下 进行 路 和 从 压缩 时 ,连续 M 
次 操作 最 多 需要 OCM log N) 的 时 间 。 不 过 , 在 这 种 情形 下 确定 平均 情况 的 性 能 如 何 仍 然 大 
一 个 尚 本 解决 的 问题 。 

路 径 压 缩 与 按 大 小 求 并 完全 兼容 , 这 就 使 得 两 个 例 程 可 以 同时 实现 。 由 于 单独 进行 按 六 
小 求 并 要 以 线性 时 间 执行 连续 M 次 运算 ， 因此 还 不 清楚 在 路 径 压 缩 中 涉及 的 额外 一 赵 工 作 
平均 来 讲 是 否 值得 。 这 个 问题 实际 上 仍然 没有 解决 。 不 过 后 面 我 们 将 会 看 到 , MEEN x 
巧 求 并 法 则 结合 在 所 有 情况 下 都 将 产生 非常 有 效 的 算法 。 

路 径 讨 缩 不 完全 与 按 高 度 求 并 兼容 , 因为 路 径 压 缩 可 以 改变 树 的 高 度 。 我 们 根本 不 清楚 
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如 何 有 效 地 去 重新 计算 它们 .答案 在 不 去 计算 11 ms oF em B rame REX ETT S 
高 度 ( 有 时 称 为 秩 一 一 rank), 但 实际 上 按 秩 求 并 ( 它 和 正 是 现在 已 经 变 成 的 这 样 ) 理 论 上 和 按 大 
小 求 并 效率 是 一 样 的 。 不 仪 如 此 , 高 度 的 更 新 也 不 如 大 小 的 由 新 同 繁 。 与 按 太 小 求 并 一 样 ， 
我 们 也 涉 清 楚 路 径 于 缩 平 均 说 来 是 否 值 得 ”下 一 节 将 让 明 , 使 用 求 并 试探 法 或 路 径 蛙 绒 都 能 
够 显 蔓 地 减少 最 坏 情 况 运 行 时 间 。 


8.6 按 秩 求 并 各 路径 压缩 的 最 坏 情 形 


当 使 用 两 种 探测 法 时 ,算法 在 最 坏 情形 下 几乎 足 线 性 的 。 特 别 地 ,在 最 坏 情形 下 需 归 的 
IAE (Na CM，N)) (假设 MƏN), É, a(M, N) Ackermann ARRIN, Acker- 
mann RRA PAE X iU 

Al, 9) = 2,1 
ALi, 1) Ati — 1,2), 722 
AQ,j) = ACi- 1, Ali, j - D), i, fee 





d 


由 此 我 们 定义 
aCM, N) = minlizi| AG, LM/N]) > log Ni 

你 可 以 想 要 计算 某 些 值 ， 不 过 实用 中 af ，N) 拓 4, XOT AE RLIE RE ERU, BES 
Ri Ackermann MAM SM log? N. EARN 的 直到 NN 去 1 ta} Bp AY A, TE. 
log" 65536 = 4, 这 是 因为 log log log log 65536 = 1. Log* 2°95 25, 不 这 要 知道 , 2° en] ze 
一 个 有 20 000 位 数字 的 大 数 ，a(M、N) 实 际 上 甚至 比 log^ N 增长 得 还 慢 。 然 而 ，a( M， 
N) 却 不 是 常数 , 因此 运行 时 间 并 不 是 线性 的 。 

在 本 节 的 其 余部 分 我 们 将 证 明 一 个 稍微 弱 一 些 的 结果 。 我 们 将 证 明 , 任意 顺序 的 M = 
NUNYX Union/Find 操作 花费 总 的 运行 时 间 为 OCM log" N) SAR FARR ADR FEC 
RE, 则 这 个 界 同 样 是 成 立 的 。 对 它 的 分 析 大 概 是 本 书 最 为 复杂 的 分 析 工 作 , 也 是 曾 对 事实 
上 实现 了 的 非常 简单 的 一 个 算法 进行 的 第 一 批 真 正 复杂 的 最 坏 情 形 的 分 析 之 一 : 

8.6.1 Union/Find 算法 分 析 

在 这 一 小 节 , 我 们 对 连续 M = (CN) 次 Union/Find 操作 的 运行 时 间 建 立 一 个 相当 产 镶 
的 界 ，Union 和 Find 可 以 以 任何 顺序 出 现 , 但 是 Union BAR PITH TT Find 则 利用 路 答 压 缩 

我 们 通过 建立 某 些 涉 及 秩 + 的 节点 个 数 的 引 理 开 始 。 直 观 地 看 ， 由 于 按 秩 求 并 的 法 则 ， 
小 秩 的 节点 要 比 大 秩 的 节点 多 得 多 。 特 别 是 , 最 多 可 能 存在 一 个 秩 为 log N 的 节点 。 我 们 想 
此 得 出 对 任意 给 定 秩 e 的 节点 个 数 的 一 个 尽 可 能 精确 的 界 。 由 于 秩 仅 当 Union 执行 (从 而 仅 
当 两 柠 树 具有 相同 的 秩 ) 时 变化 ， 因此 我 们 可 以 通过 忽略 路 径 庄 缩 来 证 明 这 个 界 。 

引 理 8.1 

当 执行 二 系列 Union 指令 时 , 一 个 秩 为 7 的 节点 必然 至 少 有 27 个 后 商 (包括 它 自己 )。 

WEBB: 

数学 归纳 法 。 对 于 基准 情形 r= 0 引 理 显然 成 立 。 令 了 是 秩 为 r a BOA fe fe CA 
Mt HO X ET 的 根 。 设 涉及 X 的 最 后 一 次 Union 是 在 T, 和 T; ATA. WT, 的 根 





— — ^ 


C) Ackermann 函数 常常 用 AC, 0 7; * 1m REX 书 中 的 形式 增长 得 更 块 ; AE, 它 的 递增 长 得 就 更 慢 。 


|272] 


208 gs 

AX, WET, HRE r, 那么 T, 就 是 -- 标 高 度 为 r WY AR, 这 与 TE 
RUB i> BROW Ra. Bk TD, BRUIT SF r-i, To MRD FET Ti 的 秩 。 
由 于 TER: 而 秩 只 能 因 T 增加 , 因此 T. RA r- ls TE T 的 秩 为 — 1. 根据 归 
AB, BRON mU 27 ! 个 后 高 , 从 而 总 数 为 2” Pe, 引 理 得 证 ， 

引 理 8.1 告诉 我 们 ， 如 果 不 进行 路 往 压 缩 ， 那么 秩 为 > 的 任意 节点 必然 至 少 有 2 个 后 
Am. 494, 路 径 压缩 可 以 改变 这 种 状况 , 内 为 它 能 够 把 后 商 从 节点 上 除去 。 Bal. MIE 
Union, RERUN, 我 们 都 是 在 使 用 秩 ,， 这些 秩 是 高 庆 的 估计 值 。 这 些 秩 的 行为 就 
像 是 没有 路 冬 压 缩 一 样 。 困 此 ， 当 确定 秩 为 r 的 节点 个 数 的 界 时 ,路径 压 第 可 以 忽略 . 

于 是 , 下 面 的 定理 对 于 有 路 径 压 缩 还 是 疫 有 路 径 压 缩 都 旦 成 立 的 。 

引 理 8.2 

秩 为 + 的 半点 的 个 数 最 多 是 N/2'， 

ut BH 

HERBER. 每 个 秩 为 e 的 节点 都 是 至 少 有 27 个 节点 的 子 树 的 根 。 在 该 子 树 中 没有 
其 秩 能 够 是 的 节点 。 因 此 , RA r 的 那些 节点 的 所 有 的 子 树 是 不 相交 的 。 于 是 ,存在 至 多 
NZ27 个 不 相交 的 子 树 ， 从 而 最 多 有 N/V 个 秩 为 r 的 节点 。 

下 一 个 引 理 看 似 多 少 有 些 显 而 易 见 , 不 过 它 在 我 们 的 分 析 中 却 是 至 大 重要 的 ， 

引 理 8.3 

在 Union/Find 算法 的 任 一 时 劾 ,从 树叶 到 根 的 路 径 上 的 节点 的 秩 单调 增加 。 

证 阴 

加 果 不 存在 路 径 压 缩 , 那么 该 引 理 显然 成 立 { 参 见 例子 )。 如 果 在 路 径 压 缩 后 某 个 节点 o 是 w 的 
— ANG, 那么 当 只 考虑 Union 时 显然 v 必然 已 经 是 w 的 一 个 后 商 了 。 因 此 。Y REF w K: 

让 我 们 来 总 结 这 些 初步 的 结果 。 引 理 8.2 告诉 我 们 多 少 节点 可 以 赋予 铁 x*。 央 为 秩 只 有 


[274 通过 Union 峰值 ， 所 以 引 理 8.2 在 Union/Find 算法 的 任何 阶段 甚至 在 路 径 压 缩 的 中 癌 痢 古 


成 立 的 。 图 8-16 指出 ， 当 存在 许多 秩 为 0 和 1 的 节点 时 , 随 着 > 的 增 大 秩 为 > PR 

s| 理 8.2 在 对 任意 秩 r 都 有 可 能 存在 NO 个 节点 的 定义 下 是 严格 的 。 但 该 引 理 还 是 稍微 
有 些 宽松 ,因为 不 可 能 对 所 有 的 秩 > 这 个 界 同 时 成 立 。 引 理 8.2 描述 了 秩 为 了 的 节点 的 个 数 ， 
而 引 理 8 .3 则 告诉 我 们 它们 的 分 布 。 正 如 所 期 望 的 , 节点 的 秩 沿 着 从 叶 到 根 的 路 径 严格 递增 。 

现在 我 们 准备 证 明 主要 的 定理 。 证 明 的 基本 想法 如 下 : 对 任何 节点 v 的 Find 所 花费 的 
时 间 与 从 vo 到 根 的 路 径 上 的 节点 的 个 数 成 止 比 。 现 在 证 我 们 对 每 个 Find 在 从 o BUR AS ERE 
的 每 一 个 节点 收取 一 个 单位 的 费用 。 为 了 帮助 我 们 计算 这 些 费 用 . 我 们 想像 在 路 径 的 每 一 
个 节点 上 存 人 一 美 分 。 严 格 地 说 这 是 一 个 会 计 诀 窃 ， 它 并 不 是 程序 的 一 部 分 。 当 算法 结束 
时 ,我 们 将 已 经 存 人 的 所 有 分 币 合 起 来 , 这 就 是 总 的 花费 。 

作为 进一步 的 会 计 诀窍 , 我 们 存 人 美 分 和 加 拿 大 分 两 种 分 币 。 我 们 将 让 明 , 在 算法 执行 
Mi, 对 于 每 次 Find 我 们 只 能 存 人 一 定量 的 美 分 。 我 们 还 将 证 明 , 我 们 只 能 存 人 一 定量 的 加 
拿 大 分 到 每 一 个 节点 上 。 把 这 两 笔 总 数 加 起 来 就 得 到 能 够 存 人 的 分 币 的 总 数 的 界 ， 

现在 稍微 详细 地 概述 我 们 的 计算 方案 。 我 们 将 按照 秩 来 划分 节点 。 把 秩 分 成 一 些 秩 组 - 
对 每 个 Find, 我 们 将 把 一 些 美 分 币 存 成 共同 的 储 金 , 而 把 加 拿 大 分 币 存 到 一 些 特定 的 项 所 
|. 为 了 计算 所 存储 的 加 拿 大 分 币 的 总 数 . 我 们 将 计算 每 个 节点 上 的 储量 。 递 过 将 秽 + 的 每 
个 节点 的 储 使 如 起 来 ,我们 得 到 每 个 秩 r 的 总 的 储量 。 然 后 ,我 们 青 把 秋 组 g PENR 
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AY Ty REMERA 5 Se RAR o We. fun. 我 们 把 每 个 秩 组 g 的 所 有 储 金 加 


到 一 起 就 得 龟 在 森林 中 存储 的 如 拿 大 分 币 的 总 数 。 把 这 笔 峙 金 即 到 作为 具 同 储 金 的 美 分 币 的 
数目 上 则 得 到 最 后 的 答案 





图 8-16 “…- 棵 大 的 不 相交 集 树 ( 节 点 下 面 的 数 是 秩 ) 


我 们 将 把 秩 划 分 成 组。 秩 + 被 分 到 组 G(x), 而 G 将 在 后 面 确 定 。 任 何 秩 组 g 中 最 大 的 
BOB Fig). 其 中 下 = G 'E GWM. Fe, 在 任何 秩 组 g > OP RN TDR FORO > 
P(e - 1) ,显然 ，G(N) 是 最 大 秩 纪 的 一 个 非常 宽松 的 上 界 。 作 为 一 个 例子 , 假设 我 们 按照 
图 8-17 将 秩 分 组 。 在 这 种 情况 下 ， G(r) =[Yr1。 在 组 g 中 的 最 大 的 秩 足 Ftg) = gri 并 
观察 到 组 p > OMAK Fle — 1) + 1 直到 Flg)。 这 个 公式 不 适用 秩 组 0, 因此 为 了 方便 ， 
我 们 将 保证 秩 组 0 只 包含 秩 为 和 的 元 素 。 注 意 ,， 这 些 秩 组 是 由 一 些 连 续 的 秩 构 成 的 。 

我 们 以 前 提 到 过 ， 只 要 每 个 根 记 录 着 它 的 于 树 都 是 多 大 , 则 
每 个 Union 指令 仅 花 费 常 数 时 间 。 因 此 ， 就 本 证 明 而 言 ，Union 
实际 下 是 不 花费 代价 的 。 








2,1,4 






每 个 Find(7) 花 费 的 时 间 正 比 于 从 代表 ;的 项 点 到 根 的 路 径 ; rough A 
上 的 顶点 的 个 数 。 因 此 , RATER -AMRA T | d — 18 + 1 through r’ 


分 币 。 不 过 , 如 果 这 就 是 我 们 所 做 的 全 部 , 那么 我 们 不 能 对 界 有 
ESHER, 因为 没有 利 几 到 路 径 计 缩 。 因 此 , 我 们 需要 在 分 析 mam 
中 利用 路 从 压缩 。 我 们 将 使 用 想像 算账 (faney aceounting) 的 方法 。 可能 的 划分 

对 内 代表 i 的 顶点 到 根 的 路 径 上 的 每 一 个 顶点 ,我 们 在 两 个 账户 之 一 存 人 一 个 分 币 : 

1 WE o ER, 或 者 o 的 父亲 是 根 , 或 者 的 父亲 在 与 6 不 同 的 秩 组 中 ,那么 在 该 法 则 

之 下 收取 一 个 单位 的 费用 , 这 就 需要 将 一 个 美 分 币 存 人 公共 储 金 中 。 

2. 否则 , 将 一 个 加 拿 大 分 币 存 人 该 贷 点 中 。 

引 理 8.4 

对 于 任意 的 Find(w), 不 论 存 人 总 储 金 还 是 存 人 顶点 , 所 存 分 币 的 总 数 恰好 等 于 从 到 
棚 的 路 径 土 的 节点 的 个 数 。 

证 明 

显然 。 

如 此 一 来 , 我 们 需要 做 的 就 是 把 在 法 则 1 下 在 人 的 所 有 的 美 分 币 利 在 法 则 2 下 存 人 的 所 


有 加 拿 大 分 币 吉 起 来 。 
我 们 进行 最 多 M 次 Find。 我 们 需要 求 出 在 一 次 Find 中 能 够 存 人 公共 储 金 中 的 分 币 个 数 的 界 。 


— 


76, 


to 
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引 理 8.5 
east Re PAE, 在 法 则 1 下 美 分 币 总 的 存 人 量 总 计 为 M(GON) 1 2). 
WE RH 
证 明 木 难 。 半 于 任意 的 Find, 由 于 有 根 和 它 的 儿子 , AAR TED. 由 引 埋 8.3， 
沿路 径 向 上 上 分布 的 节点 按 科 单调 增 ， 而 由 于 最 多 有 GON) DRA, 因此 对 任意 特定 的 Find, 
在 路 径 上 只 有 GCN) 个 其 他 节点 能 够 按照 法 则 1 存 人 分 币 。 于 是 , 在 任意 一 次 查找 期 间 最 多 
H GUN) + 2 个 美 分 币 可 以 放 入 公共 赃 金 中 因此, 在 法 则 Ob. 连续 M 次 Find 最 多 可 以 
FA M(GCN)+2) 个 美 分 币 。 
为 了 得 到 在 法 则 2 下 所 有 加 拿 大 分 币 丰 入 量 的 理想 的 知 计 值 , 我 们 将 把 按照 项 点 而 不 是 按照 
Find 指令 所 存 入 的 分 币 量 如 起 来 如果 一 梳 人 硬币 在 法 则 2 下 存 人 顶点 v, 那么 o ETRE 
被 移动 并 得 到 具有 上 比 它 原来 的 父 节 点 更 高 的 秩 的 新 的 父亲 。( 在 这 里 , 我 们 用 到 了 正在 进行 路 挫 压 
缩 的 事实 ) 于 是 , 秩 组 g > 0 中 的 节点 v 在 它 的 父 节点 被 推 离 秩 组 g 之 前 最 多 可 以 移动 Flg) - 
Flg — DY, 因为 这 是 该 秩 组 的 大 小 :在 这 以 后 , 对 o 的 所 有 未 来 的 收费 均 按 照 法 则 1 进行 。 
引 理 8.6 
PA g > 0 中 顶点 的 个 数 Vig BRANAME D, 











证 明 
由 引 理 8. 2, 至 多 存在 NA 个 秩 为 > 的 顶点 。 对 组 g 中 的 秩 求 和 , 我 们 得 到 
Fig) 
Vig) x jj N 
r=Fig-1}+1 2 
SON 
-= FÜg-1)1 2" 
c I] 
mL 一 
tl 2 
N oo 
< aF(g-1)*1 2; x 
2N 
< 2FGg-U0 ct 
EM FOD 
51 8.7 
TARA g 的 所 有 顶点 的 加 拿 大 分 币 的 最 大 个 数 至 多 是 NF (gyae 9, 
证 明 


该 秩 组 的 每 一 个 顶点 当 它 的 父 节 点 同 在 该 秩 组 时 最 多 可 以 接收 Fg) — Fle - DS 
EGO 个 加 拿 大 分 币 , 而 引 理 8.6 告诉 我 们 这 样 的 项 点 存在 的 个 数 。 通 过 简单 的 乘法 可 以 得 
到 定理 的 结果 。 

引 理 8.8 

在 法 则 2 下 总 的 存 人 分 币 数 最 多 为 ND O, FG) 287? 个 加 拿 大 分 币 。 

uk RH 

因为 秩 组 0 只 含有 秩 为 0 的 元 素 ,所 以 它 不 能 按照 法 则 2 接收 分 币 ( 这 样 的 元 素 在 该 牧 


O BOM TT ELM 1。 不 过 , PETAR Fe; 此 处 的 界 不 是 经 过 仔细 改进 的 界 。 
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SA AS E4070). EXE OR OR PU n] FB S| EE HB BAT. 

QUEE, FETS sU: AA) 2 FAM SR, 该 总 数 为 

tri) 
MOGUN) +2) + NNO Fg) APU (8.1) 

我 们 还 没有 指定 GONE ERM FON), BR, EREKE [9f] VA BS BE PESE TALE YE 
Mee, 但 是 它 应 使 得 选择 GUN) 极 小 化 上 面 的 界 有 意义 ,不 过 , AR GONO Koh. gil 
FON RISK, 这 就 影响 到 我 们 的 界 ， 一 个 明显 的 理想 选择 是 选取 FF( 门 为 由 下 (0) = 0 Al 
For) = 276 - OAE x ls, TEIA GON) = 1 Fiog Njo B 8-18 BRR HT 
何 由 此 而 划分 的 。 注 意 , 组 0 HB ERO, 这 是 我 们 在 前 面 引 理 中 更 求 的 . 下 非常 类 似 于 单 
值 Ackermann PAX, 它们 只 在 基准 情形 的 定 羡 上 有 所 不 同 (F(0) = 1). 

定理 8.1 





组 
M 次 Union 和 Find 的 运行 时 间 为 OCM log? N)。 . | 
证 明 ; | 
2 | 
把 下 和 G 的 定义 插入 到 方程 8.1 中 , 美 分 币 的 总 数 为 OMG | 10 UM | 
(N)) = OUM kg? N), 加拿大 分 币 的 总 数 为 N TT F2 | en 


53537 throogh 255» | 
truly huge ranks | 


= NNI LS NGON) = O(N leg" N) > hTM = QC), 因此 
得 出 定理 的 界 。 图 8-18 在 让 明 中 诈 到 的 

我 们 的 分 析 指 出 ,能够 通过 路 径 庄 缩 经 常 移动 的 闻 点 很 少 ， ”将 秩 分 成 秩 组 的 实际 划分 
从 而 总 的 时 间 花 费 相对 要 少 。 


8.7 一 个 应 用 


作为 怎样 可 以 使 用 该 数据 结构 的 一 个 例子 , 考虑 下 面 的 问题 。 我 们 有 一 个 计算 贫 网 纵 和 
-个 双向 连接 表 ; 每 一 个 连接 可 将 文件 从 一 台 计 算 机 传送 到 另 一 台 计 算 机 。 那 么 ， 能 否 将 一 
个 文件 从 网 络 上 的 任意 一 台 计 算 机 发 送 到 任意 的 另 一 台 计 算 机 上 去 呢 ? 一 个 附加 的 限制 是 妥 
求 该 问题 必须 联机 (on-line) 解 决 。 因 此 ， 这 个 连接 表 要 一 次 一 个 地 给 出 ， 而 算法 则 必须 能 够 
在 任 一 时 刻 给 出 答案 。 

解决 这 个 问题 的 一 个 算法 可 以 在 开始 时 把 每 一 台 计 算 机 放 到 它 让 己 的 集合 中 、 我 们 竖 求 
师 台 计算 机 可 以 传输 文件 当 且 仅 当 它 们 在 同一 个 集合 中 。 可 以 看 出 , 传输 文件 的 能 力 形 成 一 
个 等 价 关系 。 此 时 我 们 一 次 一 个 地 读 人 连接 。 当 我 们 读 人 某 个 连接 比如 (x ， 0) 时, 我 们 测试 
Rz u 和 在 同一 个 集合 中 , 如 果 它 们 在 间 一 个 集合 中 则 什么 也 不 敌 。 如 果 它 们 在 不 同 的 集 
全 中， 那么 我 们 将 它们 所 在 的 上 两 个 集合 合并 。 在 算法 的 最 后 , 所 得 到 的 图 连通 当 划 仅 当 恰好 
存在 -一个 集合 。 如 果 存 在 M 个 连接 和 和 台 计 算 机 , 那么 空间 的 需求 则 是 O(N)。 使 用 按 大 
小 求 并 和 路 径 压 缩 的 方法 , 我 们 得 到 最 坏 情 形 运行 时 间 为 O(M a (M, ND), 因为 存在 2M 
次 Kind 和 至 多 N - 1 次 Union。 这 个 运行 时 间 在 实用 中 是 线性 的 。 

在 下 一 章 我 们 将 会 看 到 一 个 好 得 多 的 应 用 。 


BA 
我 们 已 经 看 到 保持 不 相交 集合 的 非常 简单 的 数据 结构 。 当 Union 操作 执行 时 , WENTE 
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Mi, RARA EHETE, RH, AMBER, SAO M KU EO 
PME, eee A Sl AB IE EA, Union BRIM; 借助 这 一 点 , 我 们 能 够 得 到 一 个 
有 效 得 多 的 算法 ， 
(278! 路 径 压 缩 是 自 调 整 (self-adjustment) 的 最 时 形式 之 一 , RITA RAS E 7 CE, 
7 斜 推 ) 见 到 过 。 它 的 使 用 非常 有 趣 , 特别 是 从 理论 的 观点 来 看 ,因为 它 是 算法 简单 但 最 坏 悄 
形 分 析 却 并 不 这 么 简单 的 第 一 批 例子 之 一 - 


练习 


8.1 指出 下 列 一 系列 指令 的 结果 : Union(1, 2), Union(3, 4), Union(3, 5), Union(1, 
7), Union(3, 6), Union(8, 9), Union(1, 8), Union(3, 10), Union(3, t1), U- 
nion 3, 12), Union(3, 13), Union(14. 15), Union(16, 17), Union( 14, 162. U- 
nion(1, 3), Union(1, 14), “4 Union 是 
a. 任意 进行 的 。 

b. 按 高 度 进行 的 ， 
c. 按 大 小 进行 的 。 

8.2 ”对 于 上 题 中 的 每 一 棵 树 ， 用 对 最 部 节 点 的 路 径 上 庄 短 执行 一 次 Find, 

8.3 编写 -个 程序 来 确定 路 径 压缩 法 和 各 种 求 并 方法 的 效果 。 你 的 程序 应 该 使 用 所 有 
六 种 可 能 的 方法 处 理 一 系列 等 价 操 作 。 

8 4 WEBB, 如果 Union 按照 高 度 进行 , 那么 任意 - 棵 树 的 深度 则 为 O(log N)- 

8.5 a. 证 明 如 果 M = N°, 那么 M 次 Union/Find 操作 的 运行 时 间 是 OCM). 

b. 证明, WE M = N log N, 那么 M 次 Union/Find 操作 的 运行 时 间 是 OM }o 
«c. EM =@ (N log log N), Sl M 1X Union/Find 操作 的 运行 时 间 是 多 少 ? 
«d. HEM = O(N log’ N), W M 次 Union/Find 操作 的 运行 时 间 是 多 少 ? 

8.6 指出 8.7 节 中 的 程序 对 下 图 的 操作 : (1, 2), (3, 4), (3, 6), (5, 7), (4, 6), Q2, 
4), (8, 9), (5, 8). 连通 分 支 都 是 什么 ? 

8.7 ”编写 一 个 程序 实现 8.7 节 的 算法 - 

,8 8 ”假设 我 们 可 要 添加 一 个 附加 的 操作 Deunion, 它 废除 尚 林 被 废除 的 最 后 的 Union & 
f£. 
a 证明: 如 果 我 们 按 高 度 求 并 以 及 不 用 路 径 压 缩 进行 Find, 那么 Deunion 操作 容 
易 进 行 并 且 连 续 M 3X Union, Find 和 Deunion 操作 花费 OCM log NOE]; 
b， 为 什么 路 径 压 缩 使 得 Deunion 很 难 进 行 ? 
xc. 指出 如 何 实现 所 有 三 种 操作 使 得 连续 M 次 操作 花费 OUCM log N “og log N) 时 
问 。 
,8 9 ”假设 我 们 轧 要 洪 加 一 种 额外 的 操作 Remove( X) ,该 操作 把 X 从 当前 的 集合 中 除去 
并 把 它 放 到 它 自己 的 集合 中 。 指 出 如 何 修改 Union/Find 算法 使 得 连续 M 次 
Union. Find. # Remove 操作 的 运行 时 间 为 OLM a( M, N)X 
> #8.10 给 出 一 个 算法 以 一 棵 N MARAN 对 顶点 作为 输入 , HARTIA w, wE v 
Al w 的 最 近 的 公共 祖先 。 你 的 算法 应 该 以 OCN log" NN) 时 间 运 行 。 
«8.11 证 明 , 如 果 所 有 的 Union 都 在 Find 之 前 ， 那么 使 用 路 径 压 缩 的 不 相交 集 算 法 需要 
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线性 时 间 , 即使 Union 是 任意 进行 的 也 是 如 此 。 
: «8.12. 证 明 , WRR Union 操作 任意 进行 , 但 路 径 压 缩 是 对 Find 进行 , 那么 最 坏 情 形 运 
{FHT AO (M log N)。 
8.13 证 明 , 如 果 Union HAD AAA SR (S Ho. 那么 最 坏 情形 运行 时 间 为 OCM 
log * N) z 
8.14 设 我 们 通过 使 在 从 ARAR LAA ET Bim CHA GAE XD) 
以 实现 对 Find( 7) B5 4434-42 AE Si (partial path compression), XX HY [838 7 -F > ( path 
halving) - 
a， 编 写 一 个 过 程 完 成 上 述 工作 . 
b. 证 明 , 如 果 对 诸 Find 操作 进行 路 径 平分 , 则 不 论 使 用 按 高 度 求 并 还 是 按 大 小 求 
JF. Hd b SUE tat eA OCM log" ND. 
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第 9 章 图 论 算 法 


在 这 -一 童 , 我 们 讨论 图 论 中 几 个 一 般 的 问题 , 这 些 算法 不 仪 在 室 践 中 有 用 , 而且 因为 在 
许多 实际 生活 的 应 用 尝 ， 友 不 仔细 注意 数据 结构 的 选择 将 导致 球 度 过 慢 ， 所 以 这 些 算法 还 是 
SE ay Ft BRAT, 我 们 将 

* 介绍 几 个 现实 生活 中 发 生 的 问题 , 它们 可 以 转化 成 图 论 问题 。 

* 给 出 一 些 算法 以 解决 几 个 普通 的 图 论 问 题 ， 

。 指出 适当 选 拌 数据 结构 可 以 极 大 地 降低 这 些 算 法 的 运行 时 间 ， 

。 介绍 一 -个 被 称 为 深度 优先 搜索 (deptb-first searech) 的 重要 技巧 ,并 指出 它 如 何 能 够 以 

线性 时 间 求 解 若 干 表面 上 复 订 的 问题 。 


9.1 若干 定义 


— 8 (graph)G = (V. ERAS (vertex) V 和 边 (edge) 集 下 组 成 ,每 一 条 边 就 是 
— dg Co, ud, EP v, w € 六。 有 时 也 把 过 称 司 王 (are)。 如 时 点 对 地 有 有 厅 的 , 那么 图 就 
叫做 是 有 向 的 (direstcd)、 布 商 的 图 有 时 也 叫做 有 向 图 (digraph)。 顶点 v Me 34 (adjacent) 
“AW u, w) € Ko CE TRUE v, IMMA Abe, vo AAP, w Wo 邻接 
Alc BAe 邻接 ,有 了 时候 边 还 具有 第 三 种 成 分 ,， PRI weight) EAE (eost). 

图 中 的 一 条 路 径 {path) 是 一 个 项 点 序列 wey, we, wa. sls WNS ECs, wag) € 
E. 1:5; € N, 这样 一 条 路 径 的 长 (lengrh) 是 该 路 径 上 的 边 数 , EFF N — 1. M — T T es 0 
它 自 告 可 以 看 成 是 一 条 路 径 ; 如 果 路 径 不 包含 边 , 那么 路 径 的 长 为 0, 这 是 定义 特殊 情形 的 
.一 种 方便 的 方法 。 如 果 图 含有 一 条 从 一 个 硕 点 到 它 自身 的 边 (w， v). BARE v, v 有 时候 
dnd A 2K oop). 我 们 要 讨论 的 图 -一 般 将 是 元 环 的 , 一 条 贡 单 路 径 是 这 样 一 条 路 径 , 其 上 
的 所 有 顶点 都 是 互 异 的 , 但 第 一 个 顶点 和 最 后 一 个 顶点 可 能 相同 。 

有 向 图 中 的 图 {cycle} 是 满足 wi wy 且 长 至 少 为 1 的 一 条 路 径 ; 如 果 该 路 径 是 简单 路 
径 . 那么 这 个 终 就 是 简单 圈 . 对 于 无 向 图 , 我 们 要 求 边 是 互 异 的 . 这些 要 求 的 根据 在 于 无 
图 中 的 路 径 u,v, u 不 应 该 被 认为 是 圈 , HA Cu, oWo, u) IR] IRI. 但 是 在 有 问 图 
中 它们 是 两 条 不 同 的 边 , 因此 称 它 们 为 项 是 有 意义 的 。 如 果 - “个 有 向 图 没有 图 , 则 称 其 为 无 
图 的 (acyclie), 一 个 有 同 无 图 图 有 时 也 简称 为 DAG. 

如 果 在 一 个 无 疝 图 中 从 每 一 个 顶点 到 每 个 其 他 质点 都 存在 一 条 路 径 ， 则 称 该 无 问 图 起 连 
通 的 {eonneeted)。 具 有 这 样 性 质 的 有 二 匈 称 为 是 强 连通 的 (strongly connected), 如 果 一 个 有 
向 图 不 是 强 连 通 的 , 但 是 它 的 基础 图 (underlying graph), MAMEET m BERE RI, © 
连通 的 ,那么 该 有 向 图 称 为 是 弱 连 通 的 (weakly connected). 554: (complete graph) 是 其 每 一 
对 项 点 间 都 存在 一 条 过 的 图 ， 

现实 千 活 中 能 够 用 辐 进 行 模拟 的 一 个 例子 是 航空 系统 ，。 每 个 机 场 是 一 个 项 点 , 在 由 两 个 
项 点 表示 的 机 场 间 如 果 存 在 一 条 直达 航线 ， 那么 这 两 个 项 点 就 用 一 条 边 连 接 , 边 可 以 有 一 个 
A, 表示 时 间 、 距离 或 飞行 的 费用 , 有 理由 很 设 ， 这 样 的 一 个 图 是 有 向 图 , 因为 在 不 同 的 方 问 
上 飞行 可 能 所 用 时 间或 所 花 的 费用 会 不 同 ( 例 如 ， 核 赖 于 地 方 税 )。 可 能 我 们 更 愿意 航空 系统 
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是 强 连通 的 , 这 样 就 总 能 够 从 仔 一 机 场 发 到 另外 的 任意 一 个 机 场 -. 我 们 也 可 能 愿意 出 速 确定 
任意 两 个 机 场 之 问 的 最 佳 航 线 。“ 最 侍 " 可 以 是 扒 边 数 最 少 的 路 径 ， 也 可 以 是 根据 一 种 域 所 有 
的 权重 量度 所 算出 的 最 侍者 。 

交通 流 可 以 用 一 个 图 来 模型 化 。 每 一 条 街道 变 叉 站 表示 一 个 项 点， 而 每 一 条 街道 就 是 一 
条 边 . 边 的 值 可 能 代表 速度 限度 , 或 是 穷 量 (车 道 的 数目 ) 等 等 。 此 时 我 们 可 能 需要 找 出 一 条 
最 短路 ,或 用 该 信息 找 出 最 可 能 产生 交通 瓶颈 的 位 置 。 

在 本 章 的 其 余部 分 , 我 们 将 考查 图 论 的 儿 个 更 多 的 应 用 , 这 些 图 中 许多 可 能 是 相当 巨大 
AS. 因此 , 我 们 使 用 的 算法 的 效率 是 非常 重要 的 . 
9.1.1 图 的 表示 

我 们 将 考虑 有 向 图 {无 向 图 可 类 似 表示 )。 

现在 假设 可 以 从 1 开始 对 顶点 编号 。 图 9-1 中 所 示 的 图 含有 7 个 了 顶点 和 12 2832 





图 9-1 一 个 有 向 图 


表示 图 的 一 种 简单 的 方法 是 使 用 一 个 二 维 数组 , FR Oy 8 HE AE PE (C adjacency matrix) 表示 
法 ,对 于 每 条 边 (4, v), RIE Alue] = 1; 否则 , 数组 的 元 素 就 是 0, 如 果 边 有 一 个 权 ， 
那么 我 们 可 以 置 Alu jv] 等 于 该 权 , 而 使 用 一 个 很 大 惑 首 很 小 的 权 作为 标记 表 不 不 存在 的 
力 ” 栅 如 ,如 果 我 们 寻找 最 便宜 的 航空 路 线 , 那么 我 们 使 用 ce 表示 不 存在 的 航线 。 如 打出 于 
其 种 原因 我 们 寻找 最 帅 贵 的 航空 路 线 ,那么 我 们 可 以 用 值 - oo CLE VE EF ORA As FF 
在 的 边 。 

虽然 这 么 表示 的 优点 是 非常 简单 , 但 是 , 它 的 空间 需求 则 为 eC VI. an Pe e x E 
很 多 , 那么 这 种 表示 的 代价 就 太 大 了 。 GABA BH (dense): |E| = GC V|?), MAREE 
是 合适 的 表示 方法 。 不 过 , 在 我 们 将 要 看 到 的 大 部 分 应 用 中 , 情况 并 不 如 此 。 例如 , ZA 
示 一 个 街道 地 图 , 街道 的 方向 呈 曼 哈 顿 式 ， 其 中 几乎 所 有 的 街道 或 者 南北 向 , 或 者 东 廿 向 。 
因此 , 任 一 路 口 大 致 都 有 四 条 街道 , TE, 如 果 图 是 有 向 图 且 所 有 的 街道 都 是 双向 的 , 则 E 
~ 4| TV。 如果 有 3000 个 路 口 , 那么 我 们 就 得 到 一 个 3000 个 项 点 的 图 ， 该 图 有 12000 条 过 
它们 需要 一 个 天 小 为 000 000 的 数组 。 该 数组 的 大 部 分 元 素 将 起 0。 这 从 直观 看 来 很 糖 ,， A 
当 我 们 想 要 我 们 的 数据 结构 表示 那些 实际 存在 的 数据 ， 而 不 是 去 表示 不 存在 的 数据 。 

如 果 图 不 是 稠密 的 , 换 句 话说 , 如 果 图 是 稀疏 的 (sparse) , 则 更 好 的 解决 方法 是 使 用 邻接 
表 (adjaceney list) 表 示 。 对 每 一 个 顶点 ， 我 们 使 用 一 个 表 存 放 所 有 邻接 的 项 点 。 此 时 的 空间 再 
KH OUE; + IVi). BE 92 最 左边 的 结构 只 是 涉 单 元 (header cell) 的 数组 ,这 种 表示 力 法 
从 图 9.2 可 以 清楚 地 看 出 。 如 果 边 有 权 , 那么 这 个 附加 的 信息 也 可 以 存储 在 单元 中 。 





疼 9-2 图 的 邻接 表 表 示 法 


邻接 表 是 表示 图 的 标准 方法 。 无 向 图 可 以 类 似 地 表示 ; 每 条 边 (u,v) 出 现在 两 个 表 中 ， 因 
此 空间 的 使 用 基本 上 是 双 信 的。 在 图 论 算法 中 通常 需要 找 出 与 基 个 给 定 项 点 ”邻接 的 所 有 的 项 
点 。 面 这 可 以 通过 简单 地 扫描 相应 的 邻接 表 来 完成 , 所 用 时 间 与 这 些 项 点 的 个 数 成 止 比 。 

在 大 部 分 实际 应 用 中 顶点 都 有 名 字 而 不 是 数字 , 这 些 名 字 在 编译 时 是 术 知 的 。 由 于 我 们 
不 能 通过 未 知名 字 为 一 个 数组 做 索引 . 因此 我 们 必须 提供 从 名 字 到 数字 的 此 射 。 完 成 这 项 工 
作 最 容易 的 方法 是 使 用 散 列表 , 在 该 散 列表 中 我 们 对 每 个 顶点 存储 一 个 名 字 以 及 一 个 范围 在 
1 到 | V | 之 间 的 内 部 编号 。 这些 编 号 在 疼 被 访 入 的 时 候 指 定 。 指定 的 第 一 个 数 是 1. TERR 
被 输入 时 , 我 们 检查 是 否 它 的 黄 个 顶点 都 已 经 指定 了 一 个 数 , 检查 的 方法 是 看 是 骆 顶 点 企 散 
列表 中 。 如 果 在 , 那么 我 们 就 使 用 这 个 内 部 编号 , 否则 , 我们 将 下 一 个 可 用 的 编 与 分 配给 该 
顶点 并 把 该 项 点 的 名 字 和 对 应 的 编号 插入 到 获 列 表 中 。 

经 过 这 样 的 变换 ， 所 有 的 图 论 算法 都 将 只 使 用 内 部 编 续 。 由 于 最 终 我 们 还 是 要 输出 质点 
的 名 字 而 不 是 这 些 内 部 编号 , 因此 对 于 每 一 个 内 部 编号 我 们 必须 记录 相应 的 项 点 名 字 。 一 种 
记录 方法 是 使 用 字符 出 数组 。 如果 顶 点 名 字 长 , 邦 就 要 花费 大 量 的 空间 ,因为 顶点 的 省 宁 要 
存 两 次 。 另 一 种 方法 是 保留 一 个 指向 散 列表 内 的 指针 数组 , 这 种 方法 的 代价 是 稍微 损失 向 列 
表 ADT 的 纯洁 性 ( 散 列 表 的 元 素 就 不 是 通过 基本 的 散 列表 操作 来 访问 了 )。 

本 章 中 的 代码 将 尽 可 能 使 用 ADT HARS. 我 们 这 么 人知 将 节省 空间 ,当然 , 也 使 得 算法 
的 运算 表达 式 更 清晰 。 
9.2 拓扑 排 友 


拓扑 排序 是 对 有 向 无 圈 图 的 顶点 的 一 种 排序 , 它 使 得 如 果 存 在 一 条 从 v, Blu, HE, 
那么 在 排序 中 v; 出 现在 wi 的 后 面 。 在 图 9-3 中 的 图 表示 迈阿密 州立 大 学 的 课程 结构 。 有 辣 边 
(w，z') 表 明 课 程 o 必须 在 课程 ww 选修 前 修 元 、 这 些 课程 的 拓扑 排序 不 会 破坏 课程 结构 要 求 
的 任意 课程 序列 。 

BR, WES A, 那么 拓扑 排序 是 不 可 能 的 ， 因为 对 于 圈 上 的 两 个 顶点 v Mle. v 
先 于 zw Alife REF v. 此 外 , 排序 不 必 是 惟一 的 ; 性 何 合理 的 排序 都 是 可 以 的 。 在 图 9-4 
vj. Ug T uj, Urs Us. Var V]. Us» Vh 两 个 都 是 拓扑 排序 。 


中 ， Tye Ta» 1s. Tay iai. 
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E 9-4 一 个 无 图 图 
MEAM XE RARER PRA AGT. 然后 我 们 显示 出 该 砚 
点 ,并 将 它 和 它 的 边 一 起 从 图 中 删除 。 然后 , 我 们 对 图 的 其 余部 分 应 用 闻 样 的 方法 处 理 。 
为 了 将 上 这 方法 形式 化 我 们 把 顶点 o 的 入 度 {indegree) 定 义 为 边 (w，wv} 的 条 数 , RTI 
计算 图 中 所 有 顶点 的 人 人 度 。 假设 Indegree 数组 被 初始 化 且 图 被 读 人 一 个 邻接 表 中 , 列 此 时 我 
们 可 以 应 用 图 9-5 中 的 算法 生成 -个 拓扑 排序 。 
















võid 
Topsort( Graph G ) 
{ 


tnt Counter; 
Vertex V, Wi 


far( Counter = Q; Counter < NumVertex; Counter++ ) 


V = FindNewVertexOfIndegreeZerot }; 
if ( V -- NotAVertex ) 
{ 

Error( "Graph has a cycle" 3}; 


for each W adjacent to V 


| 
| break 
TopNunl v ] = Counter; 
Indegreei W 1--; 
i ; | 





naru 


图 9.5 简单 的 拓扑 排序 伪 代 码 


函数 FindNew VertexOfindegreeZero Ti Indegree 数组 ， 娃 找 一 个 尚未 被 分 配 折 扑 编 妇 
的 入 度 为 0 的 顶点 。 如 果 这 样 的 顶点 不 存在 , 那么 它 返 回 NotA Vertex; BERANE 

因为 FindNewVertexOfIndegreeZero 是 对 Indegree 数组 的 一 个 简单 的 顺序 扫描 ,所 以 每 
次 对 它 的 调用 都 花费 OC Voti. 由 于 有 | Vi KRPE R MH, 因此 该 算法 的 运行 时 加 为 
OC| VI^). 

SEE AF ah HERE POUR RH LT RT DL ACER EIE. 运行 时 间 长 的 原因 在 于 对 Indegree 2X 
aad. SUR LE, BEA Ac I TUR IR] FB 1 有 一 些 顶点 的 人 度 帘 更 新 。 然 而 ， 
时 然 只 有 一 小 部 分 发 后 变化 , 但 在 搜索 人 度 为 0 的 顶点 时 我 们 (潜在 地 ) 但 看 了 所 有 的 顶点 : 








我 们 可 以 通过 将 所 有 (未 分 配 拓 扑 编 号 ) 人 度 为 入 的 项 点 放 在 一 个 等 殊 的 合子 中 而 避免 这 
AP ACAI SF oh. JAY FindNewVertexOfIndegreeZero 图 数 返 回 ( 并 删除 ) 念 子 中 的 任 一 项 点 . 当 
我 们 降低 这 些 邻 接 顶 点 的 人 度 时 , 检查 每 一 个 顶点 并 在 它 的 入 度 降 为 0 时 把 它 放 人 盒子 中 ， 

为 实现 这 个 盒子 , 我 们 可 以 使 用 一 个 眉 tb BA BIS ABE 








或 队列 . 首先, 34 8E— T DUSTEREC BS A. 
然后 , 将 所 有 人 人 度 为 0 的 顶点 放 人 一 个 初始 


为 空 的 队列 中 : 当 队 列 不 空 时 , 删除 一 个 顶 
Bou. PRA v 邻接 的 所 有 鸣 顶 点 的 人 度 减 


4， 有 要 一 个 项 点 的 人 更 降 为 0,， 就 把 该 质心 | bi 
放 入 队列 中 此 时 , FUSER RES BA ; um 


e NER e Ed 0-6 显示 每 一 阶段 之 后 的 状态 。 | i BA or Ul I" Us a Mr | 


iT EI SC fep 9-7 中 给 j 
出 “和 前 面 一 样 , 我 们 将 假设 图 已 经 被 读 到 图 9.6 对 图 9-4 中 的 图 应 用 拓扑 排序 的 结果 
一 个 邻接 表 中 且 入 度 已 计算 并 被 放 入 一 个 数组 内 。 在 实践 中 做 这 件 工作 的 方便 方法 通常 是 把 每 
一 个 顶点 的 入 度 放 入 头 单元 中 。 我 们 还 假设 有 一 个 数组 TopNum , 该 数组 存放 的 是 拓扑 编号 。 
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| void 
Topsort( Graph G 3; 
i 
Queue Ü; 


int Counter - 0; 
Vertex V, W; 


y* 1*/ Q = CreateQueue( NumVertex }: MakeEmpty(i O 2: 
A of for each vertex V 
/* o 3*/ ifi Indegree[ V ] == 0 5 
/8 4/ Enqueue( V, QJ; 
f* 5*/ while( !IsEnpty( Q 3 ) 
{ 
/* 6&*/ Y = Degueue( Q ); 
fe Fes TopNum[ V J = «Counter;  /*Assign next number */ 
/* B*/ for each w adjacent to V 
A p*/ ifc --indegree[ W ] == 0) 
/*l0*/ Enqueue( W, Q ); 
} 
/*11*/ if ( Counter != NumVertex j 
/*i12*/ Error( "Graph has a cycle" 5; 
/Á*13*/ DisposeQueue( Q ); /* Free the memory */ 





图 中? Hei TIR hE MALTA 
站 果 使 用 邻接 表 , 那么 执行 这 个 算法 所 用 的 时 间 为 OCEL + | V1). HRR for TR 
体 对 每 条 边 项 多 执行 一 次 时 , 这 个 结果 是 明显 的 。 队列 操作 对 每 个 顶点 最 多 进行 一 次 , Me 
始 化 各 步 花费 的 时 间 也 和 图 的 大 小 成 正比 。 
03 最 短路 径 算法 
六 _ 节 我 们 考 误 各 种 最 短路 径 问 题 。 输入 是 -个 赋 权 图 : GERA v RRE 


SE EE TALL UT BRK ALA) c; j^ 一 条 路 径 Uy Ua UN ES [EL IE SS 了 Cole Ut] ft BK AR FB E 
(weighted path length). Mi 4423842 K (unweighted path length) HÆRE LANAZ, BIN 一 t 

单 源 最 短路 径 问 题 : 

给 定 一 个 赋 权 图 扣 = (V. EMII— T EE Did s 作为 输入 , 找 出 从 s 到 G 中 每 一 个 其 他 
项 点 的 最 短 赋 权 路 径 。 

例如 ,在 图 9-8 的 图 中 , 从 vi 到 os 的 最 短 赋 权 路 径 的 值 为 6, CEM vi 到 wy 到 wy 再 
到 vs 的 路 径 。 在 这 两 个 顶点 间 的 最 短 雹 权 路 径 长 为 2. 一 般 说 来 ， 当 不 指明 我 们 讨论 的 是 赋 
权 路 径 还 是 无 权 路 径 时 ， 如 果 图 是 赋 权 的 , ARERR. 还 要 注意 ,在 图 9-8 的 图 
Ji, 从 Us 到 UI 没有 路 径 。 

前 面 例 子 中 的 图 没有 负 值 的 边 , 图 9-9 中 的 图 指出 负 边 的 问题 可 能 产生 ， 从 vs 到 o4 的 
路 径 的 值 为 1, 但是, 通过 下 面 的 循环 vs, va, Uo. vs, va 存在 -条 最 短路 径 , 它 的 值 是 -3S- 
这 条 路 径 仍然 不 是 最 短 的 ,因为 我 们 可 以 在 循环 中 灌 留 任意 长 。 因 此 , 在 这 两 个 项 点 间 的 最 
短路 径 问 题 是 不 确定 的 。 类 似 地 , 从 oo, os 的 最 短路 径 也 是 不 确定 的 , 因为 我 们 可 以 进入 
十 样 的 循环 。 这 个 循环 叫做 负 值 圈 {negative-cost cycle) ; 当 它 出 现在 图 中 时 ,最短 路径 问题 惑 
是 不 确定 的 。 有 和 负 值 的 边 未 必 就 是 坏事 , 但 是 它们 的 出 现 似 乎 使 问题 增加 了 难度 。 为 方便 起 
W. 在 没有 负 值 图 时 ,从 * 到 ; 的 最 短路 径 为 0。 





图 98 有 向 图 图 99 带 有 负 值 图 的 图 


在 许多 的 例子 使 我 们 要 去 求解 最 短路 径 问 题 。 如果 顶 点 代表 计算 机 ; 边 代表 计算 机 问 的 
链接 ; 值 表 示 通 信和 的 花费 (每 1 000 字 节 数据 的 电话 费 ), 延迟 成 本 (传输 1 000 字 节 所 需要 的 
秒 数 ) 或 它们 和 :一些 其 他 因素 的 组 合 , 郁 么 我 们 可 能 利用 最 短路 问题 来 找 出 从 一 全 计算机 站 
一 组 其 他 计算 机 发 送 电 子 新 闻 的 最 便宜 的 方法 。 

我 们 可 能 使 用 图 为 航线 或 其 他 大 规模 运输 路 线 建立 模型 并 利用 最 短路 径 算法 计算 两 点 间 
的 最 佳 路 线 。 在 类 位 这 样 的 许多 实际 的 应 用 中 , 我 们 可 能 想 要 找 出 从 一 个 项 点 s 8 — TH 
5c 的 最 得 路 径 。 当 前 , 还 不 存在 找 出 从 s 到 -- 个 顶点 的 路 径 比 找 出 从 * 到 所 有 顶点 路 径 更 
快 ( 快 多 于 一 个 常数 因子 ) 的 算法 : 

我 们 将 考查 求解 该 问题 四 种 形态 的 算法 - 首先 , 我 们 要 考虑 无 权 最 短路 全 问题 并 指出 由 
何以 O(IE| + 1V') 时 间 解 决 它 。 其 次 , 我 们 还 要 介绍 , 如 果 假 设 没有 负 边 ,那么 如 何 求解 
赋 权 最 短路 径 问 题 。 这 个 算法 在 使 用 合理 的 数据 结构 实现 时 的 运行 时 间 为 OCLE T log | V1)。 

如 果 图 有 负 边 ,我 们 将 提供 一 个 简单 的 解法 ， 不 过 它 的 时 间 界 不 理想 ， 为 
OGEI- IV do 最 后 , 我 们 将 以 线性 时 间 解 决 无 图 图 的 特 味 情形 下 的 赋 权 的 问题 。 

93.1 无 权 最 短路 径 
图 9-10 表示 一 .个 无 权 的 图 Go 使 用 某 个 顶点 s 作为 输入 参数 , 我 们 起 要 找 出 从 * 到 所 有 
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其 他 项 点 的 最 短路 径 : 我 们 只 对 包含 在 路 径 中 的 过 数 有 兴趣 .因此 在 边 上 不 存在 权 ,, WR, 
这 是 赋 权 最 短路 径 问 题 的 特殊 情形 , 因为 我 们 是 以 为 有 所 有 的 边 部 赋 以 权 1, 





图 9-10 -PERAR G 


BABERE] BK AREA SAO, ion ate Aa 
Fe fal ATE ic al 

没 我 们 选择 s 为 ua. 此 时 立刻 可 以 说 出 从 到 os 的 最 短路 径 是 长 为 0 的 路 径 。 FER MA TR 
个 标记 , 得 到 图 9-11， 


Yi 


o 
Cu 


图 9-11 将 开始 节点 标记 为 通过 0 条 边 可 以 到 达 的 节点 后 的 图 


现在 我 们 可 以 开始 寻找 所 有 与 s 距离 为 1 的 顶点 - 这 些 顶 点 通过 考查 与 s 邻接 的 那些 项 
点 可 以 找到 。 此 时 我 们 看 到 ，wi 和 og Ss MERA WZ. 我们 把 它 表示 在 图 9-12 中 。 
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最 短路 径 长 为 2。 图 9-13 显示 到 现在 为 止 已 经 做 出 的 工作 。 
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my 
BOIS 找 出 所 有 从 出 发 路 径 长 为 2 的 顶点 之 后 的 峰 


最 后 , 通过 考查 那些 与 刚 被 赋值 的 v; 和 ov, 相 邻 的 项 点 我 们 可 以 发 现 , ws 和 v. 各 有 一 
Aimee. 现在 所 有 的 顶点 部 已 经 被 计算 . 图 9-14 显示 算法 的 最 后 结果 ， 
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search) 。 该 方法 按 层 处 理 顶点 : 距 开始 点 最 近 的 那些 顾 点 首先 被 | 
帕 值 ,而 最 远 的 那些 顶点 最 后 被 赋值 这 很 像 对 树 的 层 序 遍 历 | 
(level-order traversal} - 

有 了 这 种 方法 , FRAT AEC ERS. 图 9-15 Bon ix 
法 将 些 用 到 的 记录 过 程 的 表 的 初始 配置 - - 

对 于 每 个 顶点 , 我 们 将 跟踪 全 个 信息 : 首先 , 我 们 把 从 s 开始 ”图 915 用 + 无 权 最 短路 
e mii AEE RRA] a, 栏 中 。 开 始 的 时 候 , ER s 外 所 有 的 顶点 部 是 计算 的 表 的 初始 配置 
不 可 达到 的 , 而 ;的 路 径 长 为 0。P, 栏 中 的 项 为 簿 记 变 其 ， 它 将 使 我 们 能 够 显示 出 实际 的 路 
15. Known 中 的 项 在 顶点 被 处 理 以 后 置 为 1。 起 初 , 所 有 的 顶点 都 不 是 Known (LZ 8B), 包 
打开 始 硕 点 。 当 一 个 顶点 被 标记 为 已 知 时 , 我 们 就 确信 不 会 再 找到 更 便宜 的 路 径 ， 因 此 对 该 
硕 点 的 处 理 实质 上 已 经 完成 。 

基本 的 算法 在 图 9-16 中 描述 。 图 9-16 中 的 算法 模拟 这 些 网 表 , EBRA d - 0 EHI 
点 声明 为 Known, 然后 声明 4 = 1 ERIH Known, AMH d 一 2 EAHA Known. 
等 等 ,并且 将 仍然 是 de= oo MATA PERLA w TAPA d Td t l, 

BEW p, TE., 可 以 显示 实际 的 路 往 。 当 讨论 赋 权 的 情形 时 我 们 将 会 看 到 如 | 何 进 行 。 

HEUER for 循环 , 因此 该 算法 的 运行 时 间 为 OC. VO 这 个 效率 明显 地 低 ， 因为 
尽管 所 有 的 顶点 早 就 成 为 Known T, 但 是 外 层 糊 环 还 蚌 雪 继续 ， 直到 Num Vertex — 1 为 止 - 
虽然 额外 的 附加 测试 可 以 避免 这 种 情形 发 生 , 但 是 它 并 不 能 影响 最 坏 情形 运行 时 间 ， 当 以 图 
9-17 中 的 从 顶点 wo 开始 的 图 作为 输入 时 ， 通过 将 所 发 生 的 情况 推广 由 可 看 到 这 一 战 。 





void 
Unweighted( Table T 3 /* Assume T is initialized */ 


i 
| int CurrDist; 
Vertex V, W; 


| fe Vee for( Currbist = 0; Curr st < humVertex: Currbist++ ) | 
poo, Qe for each vertex V 

fe 3 if C ITD V ].Known && TE V ].Dise == CurrDist ) | 

| : 

| fe 6M TL V ].Known = True; 

fs otf fer each W adjacent to V 
| /* Brr ift TU W J.Dist == Infinity ) 
| 1 

5 Ti TE Ww ].Dist = CurrBist + 1; 
| fe By T W ].Path = V; 


} 
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Hole 无 权 最 短路 算法 的 以 代 码 


OE I-O-O-O)-O-O 
图 9-17 ”使 用 图 9 LOC ARED FC ie RR A E E 


我 们 可 以 用 非常 燃 似 于 对 拓 外 排序 的 做 法 来 排除 这 种 低 效 性 。 在 任 一 时 刻 , A A 
AQ AR A, 它们 的 ao, 一 些 顶 成 的 da= CurrDist. 而 其 余 的 则 有 cf = CurrDist 
xd. 由 于 这 种 附加 的 结构 , 在 第 2 行 利 第 3 行 搜索 整 个 的 表 以 找 出 合适 顶点 的 做 法 是 非 党 
浪费 的 。 

一 种 砷 党 简单 但 抽象 的 解决 方案 是 保留 两 个 盒子 。 1 十 盒 将 装 有 d, = CurrDist HRA 
Hom 2 SUAS d= CurrDis: + 1 的 那些 顶点 。 在 第 2 行 和 第 3 行 的 测试 可 以 用 得 找 
1 二 合 内 的 任意 顶点 代替 。 在 第 8 行 (if 语句 的 内 部 ) 以 后 , 我 们 可 以 把 w 吉 到 2# 铭 中. 在 外 
i for 循环 终止 以后 , HAESKA, 而 2 寺 盒 则 可 转换 成 1## 盒 以 进行 下 一 趟 for 循环 。 

我 们 世 到 可 以 使 用 一 个 队列 把 这 种 想法 进一步 精 化 。 在 近代 开始 的 时 收 ， 队列 只 含有 距离 
35 CurrDist 的 那些 硕 点 。 当 我 们 添加 距离 为 CarrDig + d 的 那些 邻接 顶点 时 ， 由 于 它们 自 队 尾 
人 也 ,因此 这 就 保证 它们 直到 所 有 距离 为 Cer Dist. 的 顶点 都 被 处 理 之 后 才 被 处 理 。 在 趾 离 为 
Curr Dist 处 的 最 后 一 个 顶点 出 队 并 被 处 理 之 后 ,队列 只 含有 距 议 为 CurrDist + LOIRE, 因此 
该 过 程 将 不 断 进行 下 去 , 我 们 只 需要 把 开始 的 节点 放 人 队列 中 以 启动 这 个 过 程 即 可 。 

精炼 的 算法 在 图 9-18 中 表 出 。 在 伪 代 码 中 , 我 们 已 经 假设 开始 顶点 s 是 知道 的 是 下 | 
Dis 为 0.C 例 程 可 能 把 s 作为 参数 传递 。 BER, 如 果 某 些 项 点 从 开始 节点 出 发 是 不 可 到 这 
的 .那么 有 可 能 除 列 会 过 早 地 变 空 。 在 这 种 情况 下 , 将 对 这 些 节点 报 出 Infinity( 无 穷 ) 距 离 ， 
六 就 完全 合理 了 。 最后, Known 域 没有 使 用 ; 一 个 顶点 一 旦 被 处 理 它 就 从 不 再 进入 队列 , A 
此 产 不 背 要 重新 处 理 的 事实 就 意味 着 做 了 标记 。 这 样 -- 来 , Known 域 可 以 去 掉 。 图 9-19 fitim 
我 们 一 直 在 使 用 的 图 上 的 值 在 算法 期 间 是 如 何 变化 的 。 我 们 保留 Known 域 为 的 是 使 得 过 更 
窑 易 小 用 并 使 得 与 本 节 其 余部 分 保持 一 致 。 

Ex ip SEE EC E A Fr ED. RNS, 只 要 使 用 邻接 表 ,， 则 运行 时 间 就 是 
OUE! * (Vi). 


void 
Unweighted( Table T 3 /* Assume T 15 initialized ¿Fig 9.30) */ 
i 


Queue Q: 
| Vertex V, W; 
| f* 1*7 Q = CreateQueue( NumVertex ); MakeEmpty( 0 J; 
/* Enqueve the start vertex 5, determined elsewhere */ 
| y* 2*/ Enqueue( S, Q); | 
| je 3*/ while( !IsEmpty( Q ) ) | 
| 
fr 4x? y = Degueue Q }; 
ft 5*7 TL V ].Known = True; /* Not really needed anymore "/ | 
y* 6*/ for each W adjacent to V 
A TÉ iff TE w ].Dist == Infinity ) 
1 
/* Bw TUE W ].Dist = TL V ].Dist + 1; ' 
ft 9*/ TL W ].Path = V; | 
/*10*/ Enqueue( W, Q 3; | 
l 
} ! 
f*1l*/ DisposeOueue( Q 3; /* Free the memory */ 
| | 
d rrr rr 一 一 一 一 一 — 





图 9-18 无 权 最 短路 算法 的 伪 代 码 
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图 9.19 无 权 最 短路 算法 期 间 数 据 如 何 变 化 


9.3.2 Dijkstra 算法 | uU 
如 果 图 是 峰 权 图 , 那么 问题 (明显 地 ) 就 变 得 困难 了 ， 不 过 我 们 仍然 可 以 使 用 来 自 光 权 情 


形 时 的 想法 。 | mE 
我 们 保留 所 有 与 前 面相 同 的 信息 - 因此 , 每 个 顶点 或 者 标记 为 Known( 已 知 ) 的 , 或 者 标 


记 为 unknown( 未 知 ) 的 。 像 以 前 一 样 ， 对 每 一 个 顶点 保留 一 个 临时 距离 d,。 这 个 距离 实际 上 
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是 使 用 已 知 顶点 作为 中 间 顶 点 从 s 到 ， 的 最 短路 么 的 长 。 和 以 前 一 样 ， 我 们 记录 pu. CEJ 
起 d. BARI, 

解决 单 源 最 短路 共 问 题 的 一 般 方 法 叫做 Dijkstra $32; (Dijkstra's algorithm) . 这 个 有 30 
E pg se aft ike de db HE (greedy algorithm) 最 好 的 例子 。 贪 焚 算 法 一 般 地 分 阶段 求解 一 个 问 
ml. 在 每 个 阶段 它 都 把 当前 由 现 的 当 作 是 最 好 的 去 处 理 。 例如， 为 了 用 美国 货币 找 零钱 .大 
部 分 人 首先 数 出 若干 25 分 一 个 的 硬币 (quarter), 然后 是 若干 一 角 币 ,五 分 币 和 一 分 币 。 这 种 
贪 禁 算 法 使 用 最 少数 目的 硬币 找 和 零钱 , 贪 焉 算法 主要 的 问题 在 于 , 该 算法 不 是 总 能 够 成 功 . 
为 了 找 还 15 美 分 的 零钱 ， 如 添加 12 美 分 一 个 的 货币 则 可 破坏 这 种 找 零 钱 算 法 ,因为 此 时 它 
给 出 的 答案 { 一 个 12 分 币 和 -二 个 分 币 ) 不 是 最 优 的 (一 个 角 币 和 一 个 五 分 币 )。 

. Dijkstra BPE RIAN AS PAR BE PE BEET. 在 每 个 阶段 ，Dijkstra 算法 选择 一 
个 原点 v. 它 在 所 有 未 知 顶点 中 具有 最 小 的 da 同时 算法 声明 从 Ble REE HI 
B). PPAR RAR dd, 值 的 更 新 工作 组 成 。 

在 无 权 的 情形 , Bad, = © 则 置 = d+ 1. 因此, ALH o 能 提供 一 条 更 短路 径 , 则 
我 们 本 质 上 降低 了 do 的 值 。 如 果 我 们 对 赋 权 的 情形 应 用 同样 的 逻辑 , 那么 当 di 的 新 值 
d. c. ,是 一 个 改进 的 值 时 我 们 就 置 4 = dito... 简 言 之 ,使 用 通 向 w Be LTR v 
是 不 是 一 个 好 主意 由 算法 决定 。 原始 的 秆 d. 是 不 用 vw 的 值 ; 上 面 所 算出 的 值 是 使 用 o CORE 
仅 那 些 已 知 的 项 点) 最 便宜 的 路 径 . 

图 9-20 中 的 图 是 一 个 例子 , 图 9-21 表示 初始 配置 , 假设 开始 节点 s 是 zi- 第 个 选择 的 
顶点 是 v, 路径 的 长 为 0, 该 硕 点 标记 为 已 知 。 既然 v CONI, 那么 基 些 表 项 就 需要 调整 。 邻 
接 到 v. 的 顶点 是 v 和 ovis 这 两 个 顶点 的 项 得 到 调整 ,如 图 9-22 PEFR o 





图 9-21 用 于 Dijkstra 图 922 fF uw, WE 
9-20 AEG 算法 的 表 的 初始 配置 明 为 已 知 后 的 表 


下 一 步 , 选取 ws 并 标记 为 已 知 。 硕 点 vs. os. vs. u7 是 邻接 的 顶点 , 而 它们 实际 F 都 需 
要 调整 ,如 图 9-23 所 示 。 

接着 选择 e. v 是 邻接 的 点 , 但 已 经 是 已 知 的 , 因此 对 它 没 有 工作 要 做 。vs 是 邻接 的 点 
但 不 做 调整 , 因为 经 过 w 的 值 为 2 + 10 = 12.8 KO 3 的 路 径 已 经 是 已 知 的 。 图 9-24 指出 
在 这 些 顶 点 被 选取 以 后 的 表 。 

下 一 个 被 选取 的 项 点 是 vs, BAW 3. v; 是 惟一 的 邻接 顶点 ， 但 是 它 不 用 调整 AA 
3 6 > 5 然后 选取 v 对 o 的 距离 下 调 到 3 + 5 = 8. 结果 如 图 9-25 Pro 

再 下 一 个 选取 的 项 点 是 v7 ve 下 调 到 5 + 1 = 6. 我 们 得 到 图 9-26 所 示 的 表 。 

最 后 , IDEE ve 最 后 的 表 在 图 9-27 中 表 出 - 图 9-28 通过 图 形 演示 在 Dijkstra 算法 期 
闻 各 壹 是 如 何 标记 为 已 知 的 以 及 项 点 是 如 何 更 新 的 。 





图 923 1E: 图 9.24 FF v 图 9.25 在 :xs 然后 uy 
被 声明 为 已 知 后 被 志明 为 已 知 后 





图 9-26 在 被 声明 为 已 知 后 图 9-27 在 re 被 声明 为 已 知 后 ,算法 终止 


为 了 显示 出 从 开始 顶点 到 某 个 顶点 o 的 实际 路 径 ， RIND DASS — 1 3E UH (LER ER E. p 
数组 留 下 的 足迹 ， 

MER HCH Dijkstra 算法 的 伪 代 码 。 我们 将 假设 ,为 方便 起 见 , 这 些 [jt AMO 到 
Num Verter — 1 RS (ALE 9-29) 并 假设 通过 例 程 ReadGraph 我 们 的 图 可 以 被 读 入 到 一 个 邻接 
XU. 

在 图 9-30 的 例 程 中 ， 开始 的 顶点 被 传递 到 初始 化 例 程 中 。 RS Pe AE Fe 
质点 的 地 方 。 

利用 图 9-31 中 的 递归 例 程 可 以 显示 出 这 个 路 径 。 该 例 程 递归 地 吕 示 出 直到 顶点 o B TRI 
的 顶点 的 整个 路 径 . 然后 再 显示 顶点 w。 这 是 没有 问题 的 ,因为 路 径 是 简单 的 

图 9.32 列 出 主要 的 算法 ， 它 就 是 -- 个 使 用 贪 禁 选 取 法 则 填 表 的 for 循环 、 

利用 反 证 法 的 证 明 将 指出 , 只 要 没有 边 的 值 为 负 ,该 算法 总 能 够 顺利 完成 - 如 果 任 何 一 边 出 
现 负 值 , 则 算法 可 能 得 出 错误 的 答案 ( 见 练习 9.7a)。 运行 时 间 依 来 于 对 表 的 处 理 方法 , 我 们 必须 考 
虚 , 如 果 通 过 使 用 扫描 表 来 找 出 最 小 值 d 那么 每 一 步 将 花费 OC | V1) 时 间 找 到 最 小 值 , 从 而 整 
个 算法 过 程 将 花费 OU VERMA. 每 次 更 新 du 的 时 间 是 常数 , 而 每 条 边 最 多 有 -次 
更 新 ,总 计 为 OUE). 因此, 总 的 运行 时 间 为 DG 下 | + [Lv = OVi). 如 果 图 是 稠密 的 ， 
MAE! = ed vi^» 则 该 算法 不 仅 简单 而 且 基 本 上 最 优 ， 因为 它 的 运行 时 间 与 边 数 成 线性 关系 。 

appe SEA, DIE! = eVI}, 那么 这 种 算法 就 太 爆 了, 在 这 种 情况 下 , 距离 
需要 存储 在 优先 队列 中 。 有 两 种 方法 可 以 做 到 这 一 损 ， 二 者 是 类 似 的 。 

第 2 行 与 第 5 行 联合 形成 一 个 DeleteMin 操作 ， 因为 一 旦 未 知 的 最 小 值 顶 点 被 找到 , 300 
么 它 就 不 再 是 未 知 的 , 以 后 不 再 考虑 。 在 第 9 行 的 更 新 有 两 种 实现 方法。 

-种 方法 是 把 更 新 处 理 成 DecreaseKey EE, ERT, 查找 最 小 值 的 时 间 为 O Clog | Vl, 
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即 为 执行 那些 更 新 的 时 间 , 它 相 当 于 执行 那些 DecreaseKey 操作 的 时 间 ,. 由 此 得 出 运行 时 间 
A OGE! log [IV| Vl log IVI) ~ OC Fj log ! Vi, AEX) gl rr BGT E EJ FE EG oH, 
出 于 优先 队列 不 是 有 效 地 支持 Find 操作 , 因此 d; 的 等 个 值 在 优先 队列 的 位 置 将 需要 保留 并 
4d, 在 优先 队列 中 改变 时 更 新 。 奶 果 优 先 队 列 是 用 一 尺 玲 实现 的 , 那么 这 将 很 难 办 - WSR HE 
用 配对 堆 {pairing heap 一 一 见 第 12 竟 )， 则 程序 不 会 太 益 。 















typedef int Vertex; 
struct TableEntry 


Header; /* Adjacency list */ 
int Known ; 
DistType Dist; 
Vertex Path: 


}; 


/* Vertices are numbered from 0 */ 
#define NotAVertex (-1) 
typedef struct TableEntry Table[ NumVertex ]: 





图 9-29 Dijkstra 算法 的 声明 





InitTable( Vertex Start, Graph C, Table T ) 
{ 


int i: 
A 1*/ ReadGraph( G, T 3; /* Read graph somehow */ 
| f* 2*/ for( i = 0; i < NumVertex; i++ ) 
| 
， dn a Ti i ].Known = False; 
/* APF TE i J.Dist = Infinity: 
A Shy TI i ].Path = NotA¥Vertex; 
} 
/* &*/ TE Start ].dist = 0; 





E 9-30 表 初 始 化 例 程 


| /* Print shortest path to V after Dijkstra has run */ 


/* Assume that the path exists */ | 
| void 
PrintPath( Vertex V, Table T ) 


iff TE Vv ].Path !- NotAVertex ) 
| 
PrintPath( TI V J.Path, T 3; 
printf " to" 5; 


l 
printf( "Sv", V J); /* Xv is pseudocode */ 





图 9-31 显示 实际 最 短路 径 的 例 程 




















void 
Dijkstra( Table T } 


{ 
Vertex V, Wi 


/* l*Á for( : : ) 
/* 2*/ | V = smallest unknown distance vertex; 
/" 3*/ ifi V == NotAVertex ) 
f* A break; 
i A bef TU V J].Known = True; 
| o /* 6*/ for each W adjacent to V 
ft 7? ifC !T[ w ]. Known 2 
/* arf if( TL V J.Dist + Cyw < TE W ].Dist 2 
| /* Update W */ 
/* 9*/ Decreasef TE w j.Dist to 
T[ V ].Dist + Cyw ); 
/*10*/ TE W J.Path = V; 





819.32 Diksira 算法 的 伪 代 但 
品种 方法 是 在 每 次 执行 第 9 行 时 把 w 和 新 值 d 搬入 到 优先 队列 中 去 。 RE. TED 
以 列 中 的 每 个 项 点 就 可 能 有 多 干 一 个 的 代表 。 当 DeleteMin 操作 把 最 小 的 顶点 从 优先 从 放 中 
删除 时 ,必须 检查 以 肯定 它 不 是 已 经 知道 的 。 这 样 , 第 2 行 变 成 一 个 循环 , 它 执行 DeleteMin 
二 到 一 个 未 知 的 硕 点 合并 为 止 - 这 种 方法 虽然 从 软件 的 观点 看 是 优越 的 .而且 编程 确实 容 妇 
得 多 , 但是， 队列 的 大 小 可 能 达到 | F | 这 么 大 . HT'ELIXIVI BRA lgl E; 所 
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2log | Vi, bie 3E SE eg ET fa] FE. 这样, 我们 仍然 得 到 一 个 OOE| log ' V1) 算 法 .不 
i. SERRAS MT, FEE APR ger BY, CAE. IN AIRE EX 
Tfi EW VK DeieteMin， 所 以 它 在 实践 中 很 可 能 要 慢 。 

注意 ,对 于 一 些 诸如 计算 机 邮件 和 大 型 公交 传输 的 典型 问题 , 它们 的 图 一 般 是 非 贡 稀 呈 的 ， 
因为 太 各 数 原点 只 有 少数 几 条 边 ,。 因此 ,在 许多 应 用 中 使 用 优先 队列 来 解决 这 种 问题 是 很 重要 的 ， 

如 果 使 用 不 同 的 数据 结构 , 那么 Dijkstra 算法 可 能 会 有 出 好 的 时 间 界 . 在 第 [1 E, 我 们 
将 看 到 男 寻 的 优先 队列 数据 结构 .叫做 翡 波 那 契 堆 (Fibonacci heap). 使 用 这 种 数据 结构 的 运 
PA HE OC FE! + IVI log | VI). PRI RERA ELIT IRE BT TH] ER. A. Ea BAS 
He bt Gy BRIER. 因此 , SE AS ESE HE TP SEB LA CHE RB) Dijkstra 
算法 吏 好 : 不 用 说 , RA RARA FHR Bst aR A EE erg ve Le 
PR AR fie AY AY i 
9.3.3 RAMi E 

£1 2 EUG hth, BE. Dijkstra 算法 是 行 不 和 通 的 。 问题 在 于 , 一 互 一 个 顶点 a PE 
知 的 , 那 就 可 能 从 某 个 另外 的 未 知 顶点 w 有 一 -条 回 到 uc 的 负 的 路 径 。 在 这 样 的 情形 下 , 选取 从 
s| v EEIE 的 路 径 要 比 从 到， 但 不 过 > SORT 练习 9.7{a) 概 求 构造 一 个 明晰 的 例子 -。 

一 个 诱 人 的 方案 是 将 一 个 常数 A 加 到 每 一 条 边 的 值 上 ,如 此 除去 负 值 边 , 再 计算 新 图 的 
最 得 路 径 问 题 , 然后 把 结果 用 到 原来 的 图 上 , 这 种 方案 不 可 能 直接 实现 , 因为 那些 具有 许多 
条 边 的 路 径 变 得 比 那些 具有 很 少 达 的 路 径 权 剖 更 于 了 。 

反 荆 权 的 和 无 权 的 算法 结合 起 来 将 会 解决 这 个 问题 , 但 是 要 付出 运行 时 间 激 鬼 增 长 的 代 
ft. 我 们 忘记 了 关于 已 知 的 顶点 的 概念 ， 因 为 我 们 的 算法 需要 能 够 改变 它 的 意 癌 。 开始 . 我 
们 把 s 放 到 队列 中 . 然后 , 在 每 一 阶段 我 们 让 一 个 顶点 v HB. ROAD o 邻接 的 顶点 
w. fd. dot ce. wo RAE d, Ap, 并 在 w 不 村 队列 中 的 时 候 把 它 放 到 队列 中 ， 
可 以 六 每 个 顶点 设置 一 个 比特 位 (bit) 以 指示 它 在 队列 中 出 现 的 情况 。 我 们 重复 这 个 过 程 百 到 
队列 为 宝 - 图 933( 儿 平 ) 实 现 这 个 算法 : 





void /* Assume T is initialized as in Fig 9.18 */ 
WeightedNegative( Table T ) 
Í 


Queue Q; 
Vertex V, Wi 
A i Q = CreateQueue( NumVertex 3; MakeEmpty( Q 3; 
jo /7 aes Enqueue( 5, Q 1; /* Enqueue the start vertex 5 */ 
| 
/* 3*/ while? !IsEmpty( Q } j 
1 
| y* o 4*/ V = Daqueue( Q J; 
/* otf for each W adjacent to V 
/* otf if( TL ¥ ].Uist + Cvw < TL W ].Dist 3 
/* Update W */ 
ft 7*/ TL W ].Dist = TL V J.Dist + Cvw; 
/* B"/ T[ Ww ].Path = V; 
/* o*/ if( w is not already in Q ) 
/*i10*/ Engueuet W, Q 3; 
] 
j 
/*ll*/ DisposeQueue( Q 7; 
l 





T 


图 933 FOR Re RS 
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ALR ARR GS LR AC HE EE TE TAE, 但 是 , 第 6 行 到 第 10 行 的 代码 每 过 只 执行 - : 
次 的 情况 不 再 成 立 . 每 个 顶点 最 客 可 以 出 队 1 V1 次 , 因此 、 如 采信 用 邻接 表 则 运行 时 间 是 O 
(JE VV ) (练习 9.7b). 这 比 Dijkstra 算法 多 很 多 , cede By. SCEX DA BB dE OD). 如 
尝 负 值 图 存在 , 那么 所 写 的 算法 将 无 限 循 环 下 去 。 通过 在 件 一 质点 已 经 出 队 1V' + 1 次 后 个 
止 算法 运行 ,我 们 可 以 保证 它 能 终止 - 
9.3.4 TAH 

11 RGA EPA, 那么 我 们 可 以 通过 改变 声明 硕 点 为 已 知 的 肪 序 , Pe AR Te i 
HEM | 来 改进 Dijkstra 算法 , BLM LINO DERE TEL. 由 于 选择 和 更 新 可 以 在 拓扑 排 
FEB BSI ETT. 因此 算法 能 够 一 超 完 成 . 

因为 当 一 个 顶点 v BEER LU. 按照 拓扑 排 译 的 法 则 , CRRA YOR MT REA 
所， 因此 它 的 距离 d, 可 以 不 再 被 降低 ,所 以 这 种 选 拌 法 则 是 行 得 通 的 

使 用 这 种 选择 法 则 不 需要 优先 队列 ; 由 于 选择 花费 常数 时 间 , 因此 运行 时 间 为 OCIE|+ 

V 

ABI PE RT La PF HEC SERT $ 1148 E JA A a 到 点 5, HH REGE PIE. mA 
可 能 有 效 。 另 一 个 可 能 的 应 用 是 (不 可 逆 ) 化 学 反应 模型 . 我 们 可 以 让 每 个 项 点 代表 实验 的 一 
个 特定 的 状态 , 证 边 代 表 从 一 种 状态 到 另 一 种 状态 的 转变 ， 市 边 的 权 代 表 释 放 的 能 最 QW 
只 能 从 高 能 状态 转变 到 低能 状态 ,那么 图 就 是 无 圈 图 . 

无 圈 图 的 一 个 更 重 此 的 用 途 是 关键 路 径 分 析 法 (critical path analysis)» 我 们 将 用 图 0-34 
中 的 图 作为 我 们 的 例子 , 每 个 节点 表示 一 个 必须 执行 的 动作 以 及 完成 动作 所 花费 的 时 间 。 因 
此 .该 图 呀 做 动作 节点 图 (activity_node graph)。 图 中 的 边 代表 优先 关系 : Bic, w) XE 
着 动作 o 必须 在 动作 zw 开始 前 完成 。 当然 , 这 就 意味 着 图 必须 是 元 于 的 : Fi Hec CER CH 
接 或 间接 ) 互 相 丰 依赖 的 动作 可 以 由 不 同 的 服务 器 并 行 地 执行 。 





图 9-34 动作 节点 图 


这 种 类 型 的 图 可以 (并 常常 ) 被 用 来 模拟 方案 的 构建 。 在 这 种 情况 下 , ILT IIS SE I 
4. He. 方案 最 早 完成 时 间 是 何 时 ?从 图 中 我 们 可 以 看 到 , tae A, C, F, 万 需要 10 个 
时 间 单 位 。 另 一 个 重要 的 问题 是 确定 哪些 动作 可 以 延 尖 , ERER, 而 不 至 于 影响 最 少 完 成 
时 间 。 例 如 , 延迟 A, C. 下, 日 中 的 任 -个 部 将 使 完成 时 间 推 到 10 个 时 间 单 位 以 后 - 另 一 方 
面 , 动作 BREF, 可 以 被 延迟 两 个 时 间 单 位 而 不 至 于 影响 最 后 完成 时 间 。 

为 了 进行 这 些 运 算 ， 我 们 把 动作 节点 网 转化 成 事件 节点 图 4evencnode graph). 每 个 事件 
对 应 一 个 动作 和 所 有 与 它 相关 的 动作 的 完成 。 从 事件 节点 图 中 的 节点 o 可 达到 的 事件 可 以 在 
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SF v SERT AS. XPT BR sx. Ea A CHE. NEE cx uj SETS Sede A RI 
— “Pah ti fs SL PS Bs EREA. A T S| ERA SEE (aR PEA ER RR), 这 么 做 
是 必要 的 .对 应 图 9-34 的 事件 节点 图 如 图 9-35 所 示 。 





图 9.35 事件 节点 图 


为 了 找 出 方案 的 最 时 完成 时 间 , 我 们 只 要 找 出 从 第 一 个 事件 到 最 后 - -个 事件 的 最 长 路 答 
的 长 . 对 于 一 - 般 的 图 , 最 长 路 径 问 题 通 常 没有 意 儿 ,因为 可 能 有 正 值 的 网 ( positive-cost cycle) 
存在 ; 这 些 正 值 轿 等 价 于 最 短路 问题 中 的 负 值 痢 ,。 REL ER ALIE ERR, 邦 么 我 们 可 以 寻找 最 长 
的 简单 路 径 ,不 过 , 对 于 这 个 问题 没有 已 知 的 圆满 的 解决 方案 。 由 于 事件 节点 图 是 无 圈 图 ， 
因此 我 们 不 必 担 心 圈 的 问题 . 在 这 种 情况 下 , 容易 采纳 最 短路 径 算 法 计算 图 中 所 有 蔬 点 最 早 
完成 时 间 。 如 果 EC, 是 节点 i BUR CEU TRE, 那么 可 用 的 法 则 为 

EC,— 0 
EC, — max (EC, + co, w) 


17, u EE 


图 9-36 显示 在 我 们 的 实例 事件 节点 图 中 每 个 事件 的 最 早 完成 时 间 。 


C/3 





图 9-36 Be Sd RATA] 


我 们 还 可 以 计算 每 个 事件 能 够 完成 而 不 影响 最 后 完成 时 间 的 最 晚 时 间 LC;。 进行 这 项 工 
作 的 公式 为 


LC, = EC, 
LC. = _ min J LO, Eo.) 
对 于 每 个 顶点, 通过 一 个 保存 所 有 邻接 且 在 先 的 项 点 的 表 , 这 些 值 就 时 以 以 线性 时 间 算 出 ， 


殿 助 项 点 的 拓扑 顺序 计算 它们 的 最 早先 成 时 司 ， 而 最 晚 完成 时 间 则 通过 倒转 它们 的 拓扑 顺序 
来 计算 . 最 晚 完成 时 间 如 图 9-37 Bras - 





图 9.37 See So ART IB] 
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十 件 节点 图 中 每 条 边 的 松弛 时 间 (slack time}) 代 表 对 应 动作 可 以 被 延迟 而 不 推迟 整体 的 
完成 时 间 量 。 容易 看 出 
Sacki., = LG, - EC, Ca, u 
0-38 指出 在 事件 节点 图 中 每 个 动作 的 松弛 时 间 ( 作 为 第 二 项)。 Pa A, MERR E 
Fe HL BRENT Val, 底下 的 数 是 最 晚 完成 时 间 。 


rm O30 





H 9-38 最 早 完 成 时 间 .、 Be wee LT Tal AAS e [8] 


基 些 动作 的 松弛 时 间 为 零 , 这 些 动作 是 甘 键 性 的 动作 ,它们 必须 按 计 划 绪 率 。 至 少 存在 
一 条 完全 出 零 -松弛 边 组 成 的 路 径 , 这 样 的 路 径 是 关键 路 径 (critical path). 
9.3.5 所 有 点 对 最 短路 径 

有 时 重要 的 是 要 找 出 图 中 所 有 顶点 对 之 间 的 最 短路 径 。 虽 然 我 们 可 以 运行 | Y| 次 适当 的 
单 源 算 法 , 但 是 如 果 要 立即 计算 所 有 的 信息 , 我 们 还 是 期 望 有 更 快 的 解法 , CAA CT HE 
的 图 、 

在 第 10 章 , 我 们 将 看 到 对 赋 权 图 求解 这 种 问题 的 一 个 OC WV”) 算 法 。 虽然 对 于 秽 窗 图， 
它 只 有 和 运行 | | 次 简单 ( 非 优先 队列 )Dijkstra 算法 相同 的 时 间 界 , 但 是 循环 是 如 此 地 暴 凌 
以 敏 记 有 专门 的 点 对 算法 很 可 能 在 实践 中 会 更 快 。 当 然 , 对 于 稀 玖 图 哆 快 的 是 运行 Y 次 用 
优先 队列 编写 的 Dijkstra 算法 。 


9.4 MAMA 


设 给 定 边 容量 为 ce。, 的 有 向 图 G = (V, E), 这 些 容 量 可 以 代表 通过 一 个 省 道 的 水 的 
流量 或 在 两 个 交叉 路 口 之 间 马 路 上 的 交道 流量 。 有 两 个 顶点 ,一 个 是 ;, RARA Loure), 
个 是 1， 称 为 收 点 (sink)。 HT-RA, w), MLAWA co 个 单位 可 以 通过 . 在 
既 不 是 发 点 APERA: 的 任 一 顶点 zw， 总 的 进入 的 流 必 须 等 于 总 的 发 出 的 流 : 最 大 流 问 题 
就 是 确定 从 s 到 可 以 通过 的 最 大 流量 . 例如. 对 于 图 9-39 中 左边 的 图 , 最 大 流 是 5, 如 石 边 
的 图 所 朱 。 
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图 9390 一 个 图 (左边 ) 和 它 的 最 太 流 
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A, CHL 3T 30 NL EE e Mdo DA d 从 a Mb 得 到 3 个 单位 的 流 , 并 把 它们 结合 i; 
来 发 送 到 1 一 个 顶点 可 以 以 它 喜 欢 的 任何 方式 结合 和 发 送 流 ,只 要 不 违反 边 的 容 景 以 太保 
持 流 守恒 ( 进 入 必须 流出 )。 

9.4.1 一 个 简单 的 最 大 流 算法 

解决 这 种 问题 的 首要 想法 是 分 阶段 进行 ,我们 从 图 G 开始 并 构造 -… 个 流 图 G,。G, 表示 
在 算法 的 任意 阶段 已 经 达到 的 流 。 开始 时 Gy 的 所 有 的 边 都 没有 流 , Sell CH EET A qb NI 
(包含 最 大 流 。 我 们 还 构造 一 个 图 G., PARR A (residual graph), 它 表示 对 于 每 条 边 还 能 
再 添加 上 多 少 流 。 对 于 每 -- 条 边 , 我 们 可 以 从 容量 中 减 去 当前 的 流 而 计算 出 残余 的 流 。G; 的 
WOU fig FX ae i (residual edge). 

在 每 个 阶段 , 我 们 寻找 图 G, 中 从 * Ble 的 一 条 路 径 , PRR ET RU KB (augmenting 
pathy。 这 条 路 径 上 的 最 小 值 边 就 是 可 以 添加 到 路 径 每 一 边 王 的 流 的 量 - 我 们 通过 调整 C 和 
重新 计算 G, 做 到 这 -一 点 。 当 发 现在 G, 中 没有 从 xs 到 + 的 路 径 时 算法 终止 : 这 个 算法 是 不 确 
定 的 , 因为 从 * 到 * 的 路 径 是 任意 选择 的 。 显 然 , 有 些 选 择 会 比 另 外 一 些 选择 好 , 后 面 我 们 再 
外 理 这 个 问题 , 我 们 将 对 我 们 的 例子 运行 这 个 算法 。 下 面 的 图 分 别 是 G. G, 和 避 .。 要 记者 这 
个 算法 有 一 个 小 欠缺。 初始 的 配置 见 图 9-40。 





图 940 PL, 沪 图 以 及 残余 图 的 初 妨 阶 段 
在 残余 图 中 有 许多 从 ， 到: 的 路 径 。 假设 我 们 选择 s., doro 此 时 我 们 可 以 发 送 2 个 
单位 的 流通 过 这 条 路 径 的 每 一 过 。 我 们 采 皮 如 上 约定 : 一 巧 注 满 (使 饱和 ) 一 条 边 ,， 则 这 条 过 
就 要 从 残余 图 中 除去 。 这 样 , 我 们 得 到 图 9-41. 





图 941 Ws, 86,d ,加 入 2 个 单位 的 流 后 的 GG、 


Fai. 我们 可 以 选择 路 徐 ;、a c, c, 该 路 径 也 容许 2 个 单位 的 流通 过 。 进行 必要 的 调 
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整 后 ,我 们 得 到 图 9-42 中 的 图 - 





图 9-42 Hs, a, ct 加 入 2 个 单位 的 流 后 的 上 GG、 G, 


惟一 剩 下 要 选择 的 路 径 是 *，a , d. 1. 这 条 路 径 能 够 容纳 一 个 单位 的 流通 过 。 结果 得 到 
图 9.43 所 示 的 图 。 





图 9-43 i$ s.a. d. : 加 入 1 个 单位 的 流 后 的 上 GG. G, 





算法 终止 


由 于 + 从 s 出 发 是 不 可 达到 的 . 因此 算法 到 此 终 正 ; 结果 正好 5 个 单位 的 流 是 最 大 值 : 为 
了 看 清 问题 的 所 在 , 设 从 初始 图 开始 我 们 选择 路 径 *，a, d, 1, 这 条 路 径 容 纳 3 个 单位 的 流 , 因 
而 好 像 是 个 好 选择 。 然 而 选择 的 结果 却 使 得 在 残余 图 中 不 再 有 从 :到 + 的 任何 路 径 , 因此 ,我 
们 的 算法 不 能 找到 最 优 解 。 这 是 贷 禁 算法 行 不 通 的 一 个 例 于 。 图 9-44 指出 为 什么 算法 会 失败 。 





9.44 ”如 果 初 始 动 作 是 沿 s.a, d, c 
人 3 不 单位 的 流 得 到 G、Gr、G, 一 一 算法 终止 但 解 不 是 最 优 的 


为 了 使 得 算法 有 效 , 我 们 需要 让 算法 改变 它 的 意向 。 AK, 对 于 流 图 中 具有 流 fo, 的 每 
一 边 (w，w) ,我们 将 在 残余 图 中 添加 一 条 容量 为 A Alw, v) ERL, REREH 
以 相反 的 方向 发 回 一 个 流 而 使 算法 改变 它 的 总 问 。 通过 例子 最 能 看 清 这 个 问题 。 我 们 从 原始 
的 图 开始 并 选择 增长 通路 s, a. d. c, 得 到 图 9-45 中 的 图 。 





图 845 使 用 正确 的 算法 灌 :， a.d. (MMA OP PRBS 


注意 ,在 残余 图 中 有 些 边 在 a Md 之 问 有 两 个 方向 。 或 者 还 有 一 个 单位 的 注 可 以 从 a 导 i 
Hd, 或 者 有 高 过 3 个 单位 的 流 导向 相反 的 方向 一 -我 们 可 以 撤销 流 。 现 在 算法 找到 流 为 2 ， 
的 增长 通路 s. b, dy a. cy te 通过 从 df Bla 导入 2 个 单位 的 流 , 算法 从 边 (a, a) 取 走 2 个 上 3 出 
单位 的 的 流 ， 因 此 本 质 上 改变 了 它 的 意向 - 图 9-46 显示 出 新 的 图 。 








Elo.46 ”使 用 正确 算法 沿 5， 5. d. asc, t 加 入 2 个 单位 的 流 后 的 图 


在 这 个 图 中 没有 增长 通路 , 因此 , 算法 终止 。 奇怪 的 是 , 可 以 证 明 , 如 果 边 的 容量 部 是 有 
理 数 .那么 该 算法 总 以 最 大 流 终止 。 证 明 多 少 有 些 困难 ,也 超出 了 本 书 的 范围 。 虽 然 例 子 正 
EAM, 但 这 并 不 是 算法 有 效 工 作 所 必须 的 。 我 们 使 用 无 圈 图 只 是 为 了 简明 。 

如 果 容 量 都 是 整数 日 最 大 流 为 了, 那么 , 由 于 每 条 增长 通路 使 流 的 值 至 少 增 1, S FE 
段 足够 ,从 而 总 的 运行 时 间 为 0{f* |E|), 因为 通过 无 权 最 短路 径 算 法 一 条 增长 通路 可 以 
以 OCIE|}) 时 间 找 到 , 说 明 这 个 运行 时 间 为 什么 不 好 的 经 典 例子 由 图 9-47 Som 





NI 
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图 9.47 经 典 的 坏 的 增长 情形 一 一 
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最 大 流通 过 治 每 条 边 发 送 1 000 000 并 查验 到 2 000 000 MAH. 随机 的 增长 通路 可 以 沿 
OPH a 利 户 连接 的 边 的 路 径 连 续 增 长 . 要 是 这 种 情况 重复 发 生 , 那 就 需要 2 000000 条 增长 
通路 ， 而 此 时 我 们 仅 用 2 条 增长 通路 就 能 得 到 最 大 流 ， 

避免 这 个 问题 的 简单 方法 是 总 选择 使 得 流 增长 最 大 的 增长 通路 ,. 寻找 这 样 - :条 路 径 类 似 于 
求解 一 个 赋 权 最 短路 径 问 题 而 对 Dijkstra 算法 的 单线 (singleine) 修 改 将 会 完成 这 项 下 作 - 如 果 
COP mar SERA, 那么 下 以 证 明 . OGE, log cap,,) 条 增长 通路 将 是 以 找到 最 大 流 ,. 在 这 种 
情况 下 , 由 于 对 于 增长 通路 的 每 一 次 计算 都 需要 OC Riog V'OBa. 因此 总 的 时 间 界 为 
OCE log | VI log capa. 如果 容 量 均 为 小 整数 ,到 该 界 可 以 减 为 OCE "log VI) 

男 一 种 选择 增长 通路 的 方法 是 总 选取 具有 最 少 边 数 的 路 径 ， 有 理由 设想 , 通过 以 这 种 方 
式 选 择 路 径 不 太 可 能 使 该 路 径 上 出 现 一 条 小 的 、 对 流 有 限制 的 边 。 使 用 这 种 法 则 , 可 以 证 明 
EE OE VRK, 每 一 步 花费 OC 五 | )， 再 使 用 无 权 最 短路 径 算法 , 产生 运行 时 间 
RA OGEPIVID 

有 可 能 对 这 一 算法 进行 进 - 步 的 数据 结构 收 进 ， EL PS RIB. 长 期 以 来 对 
界 的 改进 降低 了 该 问题 当前 熟知 的 界 , 虽然 尚未 见 到 OCLET; V1) 算 法 的 报告 , fBIE— EH 
AR OUE!|Vilg( VŽAE' DÄ OUE Vit VC 的 算法 已 经 被 发 现 { 见 参考 文 
0. 还 有 许多 在 一 些 特殊 情形 下 非常 好 的 界 . 例如 , 车 图 除 发 点 和 收 点 外 所 有 的 项 后 都 有 一 
条 容量 为 1 的 入 边 或 -- 条 容量 为 1 的 出 边 ， 则 沪 图 的 最 大 流 可 以 以 时 间 OC E: V. '“) 找 
到 这 些 图 出 现在 许多 应 用 中 . 

产生 这 些 界 的 分 析 过 程 是 相当 复杂 的 , FORA RARE OP 
的 运行 时 间 发 生 关 系 的 。 一 个 相关 的 、 甚至 更 困难 的 问题 是 最 小 值 流 {min-cost flow) 问 题 Be 
某 边 不 仅 有 容量 , 而 且 还 有 每 个 单位 流 的 { 价 ) 值 , 而 问题 则 是 在 所 有 的 般 大 流 中 找 出 一 个 最 
小 { 价 } 值 的 流 来 。 目前 对 这 两 个 问题 的 研究 都 在 积极 地 进行 。 


9.5 最 小 生成 树 


我 们 将 要 考虑 的 下 一 个 器 题 是 在 一 个 匹 向 图 中 找 出 一 棵 最 小 生成 树 Cminimum spanning 
rec). 这 个 问题 对 有 向 图 也 是 有 意义 的 ,不 过 找 起 来 更 困难 . 大 体 上 说 来 , 一 个 无 向 终 G 的 
最 小 牛 成 树 就 是 由 该 图 的 那些 连接 G 的 所 有 项 点 的 边 构 成 的 树 , 匡 其 总 价值 最 低 ; 最 小 生成 
树 存在 当日 仅 当 G 是 连通 的 。 虽然 一 个 健壮 的 算法 应 该 指出 G 不 连 首 的 情况 , 但 是 我 们 还 
是 假设 G 是 连通 的 , 而 把 算法 的 健壮 性 作为 练习 留 给 恋 音 : 

在 图 9-48 中 第 二 个 图 是 第 一 个 图 的 最 小 生成 树 { 碰 睫 还 是 惟一 的 , [Exc MR RECTR 
BO. HE. 在 最 小 生成 鱼 中 边 的 条 数 为 | V| 一 1。 最 小 生成 树 是 一 棵 树 , AAR; 因为 最 
小 生成 树 包 含 每 一 个 项 点 ,所 以 它 是 生成 树 ; 此 外 , 它 显然 是 包含 图 的 所 有 顶点 的 最 小 的 树 。 
如 果 我 们 需要 用 最 少 的 电线 给 一 所 房子 安装 电路 , 那 就 需要 解决 最 小 生成 树 问 题 。 

对 于 任 一 生成 树 工 , 如 果 将 一 条 不 属于 T 的 边 e WINER, 则 产生 一 个 圈 ， 如 果 从 该 网 
中 除去 任意 一 条 边 , 则 又 恢复 生成 树 的 特性 - MRA e 的 值 比 除去 的 边 的 值 低 ,那么 新 的 后 
成 树 的 值 就 比 原生 成 树 的 值 低 : 如 果 在 建立 生成 树 时 所 添加 的 边 在 所 有 避免 成 圈 的 边 中 便 基 
As, 那么 最 后 得 到 的 生成 树 的 值 不 能 再 改进 ， 因为 任意 一 条 替代 的 边 的 值 都 大 于 等 于 书 经 在 
在 于 该 生成 树 中 的 一 条 边 的 值 . ETE 对 于 最 小 生成 树 这 种 贪 答 是 成 立 的 ; 我 们 介绍 两 种 
算法 ,它们 的 区 别 在 于 最 小 ( 值 的 ) 边 的 选取 上 。 





图 9.48 E GAEREN 


9.5.1 Prim 算法 

计 等 最 小 生成 柑 的 一 种 方法 是 使 其 连续 好 一 步 步 长 成 。 在 每 一 步 ， 都 要 把 一 个 节点 当 作 
根 并 往 上 加 边 , 这 样 也 就 把 相关 联 的 顶点 加 到 增长 中 的 钳 上 。 

在 算法 的 任 一 时 刻 , 我 们 都 可 以 看 到 --- 个 已 经 诺 加 到 树 上 上 的 顶点 集 ， MARA 
到 这 棵 树 中 。 此 时 , 算法 在 每 一 阶段 都 可 以 通过 选择 边 (u，w), 使 得 (Cu,，%) 的 值 是 所 有 u 在 [314 
树 上 但 o 不 在 树 上 的 边 的 值 中 的 最 小 者 ， 而 找 出 一 个 新 的 顶点 并 把 它 添加 到 这 棵 树 中 -图 
9 .49 指 出 该 算法 如 何 从 o, 开始 构建 最 小 生成 树 . 开始 时 ,wi 在 构建 中 的 树 上 , 它 作为 树 的 根 
但 是 没有 按 。 每 一 步 添加 一 条 边 和 一 个 顶点 到 树 上 。、 
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图 9-49 在 每 一 步 之 后 的 Prim 算法 
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我 们 可 以 看 到 ,Prim 算法 基本 上 和 求 最 短路 从 的 Dijkstra 算法 一 样 , 因此 和 前 面 一 样 ， 
我 们 对 每-- 个 项 点 保留 值 d, Alp, 以 及 一 个 掉 标 , OS RLS EO known) 835 BARI 
(unknown) hj- 这 里 , d. 是 连接 ww 到 已 知 顶 点 的 最 短 边 的 权 ， 而 p. Ru A pd, RE RR 
的 项 点 ,算法 的 其 余部 分 完全 一 样 ， 只 有 一 点 不 同 : WF d, 的 定 文 不 同 , 因此 它 的 更 新 法 则 
也 不 同 SL, 更 新 法 则 比 以 前 更 简单 : 在 每 - -个 顶点 eo 被 选取 以 后 .对 十 每 -- 个 与 vw R 
TERR HRI w, da= minl elas Ca ,js 

ZEN HEIRS HB 9-50 指出 。z PEER, v, v3. vy 被 更 新 结果 由 图 9-51 中 的 表 指 
册 下 一 个 顶点 选取 S. 每 一 个 质点 部 与 v, 邻接 . vl 不 考虑 ,因为 它 是 已 知 和 的 . vs PE, 
因为 d= 2 而 且 从 ms 到 o; 的 边 的 值 是 3; 所 有 其 他 的 顶点 都 被 更 新 。 岗 9-52 显示 得 到 网 结 
go 下 -个 要 选取 的 顶点 是 vs。 这 并 不 影响 任何 路 离 。 然 后 选取 os. 它 影响 到 we IER, M 
[& 9-53, 选取 v; 得 到 图 9-54, o; 的 选取 迫使 v6 和 ws 进行 调整 。 然后 分 别 选取 we 和 vs, $ 
法 元 成 . 

最 后 的 表 在 图 9-55 中 给 出 , "Rag x AM PIL: Cus, uy). Cus. t4), Cea, 
ay). Cus, V7)» ( Us. v1). v3, Vala 生成 树 总 的 值 是 16 




















Hj 0-50 在 Prim 算法 中 图 9-51 XE vj [8 9-52 TE v, 
i RE SE RS 声明 为 已 知 后 的 表 声明 为 已 知 后 的 表 
i Known 4, Pe | 
no o' | Of 
| LI l 2 t'I i 
ea | 
ey 1 á v | 
Ma l | m 
un i 4 gà 
[] 9-53 TE t 和 us 图 9-54 在 vw 图 955 XE vj Mus 
LAP AAG PAR 声明 为 已 知 后 的 夫 PERG HR Prim 算法 终止 )} 


该 算法 整个 的 实现 实际 上 和 Dijkstra 算法 的 实现 是 一 样 的 . 对 于 Dijkstra BE ay A BR AE 
的 每 APSE LAA PAREA, Prim 算法 是 在 无 向 图 上 运行 的 . 因此 当 编 写 代 码 
的 时 候 要 记 住 把 每 一 条 边 都 要 放 到 两 个 邻接 表 中 。 APR A OC. V.D. EXT 
ASE EY PE «HE TT Tle OC Ejlog| V D, SF RRM Tz 3E— T 


ABE. 





9.5.2 Kruskal 算法 Un x* f] 
BH AE a a EE R DATE, FRAMERS |o 1 mm 

这 不 产生 立时 就 把 它 作为 取 定 的 边 该 算法 对 于 前 而 例子 中 的 网 的 | ium zr 
实现 过 程 如 图 9-56 所 示 。 [uer 2 接受， 
形式 上 ，Kruskal 算法 是 在 处 理 一 个 条 林 一 一 树 的 集合 开始 的 oos s as d 
Oe, (El Vi 棵 单 节点 树 ,而 添加 一 边 则 将 两 棵 树 合并 成 -- 棵 树 。| 5 ARS 
当 儿 法 终止 的 时 候 ,就 只 有 一 棵 树 了 ,这 棵 树 就 是 最 小 生成 岩 。 图 — 
9-57 TrA BUS DLL CB AS sS Kruskal Rui 
HTA GER 








957 存 每 -- 生 之 后 的 Kruskal 算法 
当 添 加 到 森林 中 的 边 是 够 多 时 算法 终止 。 实际 上 , 算法 就 是 要 决定 边 (x，w) 应 该 添加 还 
是 放弃 。 前 一 音 中 的 Union/Find 算法 在 这 里 通用 。 
我 们 用 到 的 一 个 恒定 的 事实 是 , 在 算法 实施 的 任 一 时 刻 ,， 两 个 顶点 属于 同 ~ 个 集合 当日 
仅 当 它们 在 当前 的 生成 森林 (spanning forest) 1 E38 o 因此 , 每 个 顶点 最 初 是 在 它 自己 的 集合 
Ih, 如果 Alo 在 同一 个 集合 中 , 那么 连接 它们 的 边 就 要 放弃 , 因为 由 于 他 们 已 经 连通 了 ， 
轨 此 再 洪 加 边 { wx，w) 就 会 形成 一 个 圈 。 如 果 这 两 个 硕 点 不 在 同一 个 集合 中 , 则 将 该 过 加 入 ， 
并 对 包含 项 点 a Me 的 这 两 个 集合 实施 一 次 合并 ,. 容易 看 到 ,这样 将 保持 集合 不 变性 , 因为 
-HfiCu, vw) 添加 到 生成 森林 中 , Aw 连通 到 4 而 x 连通 到 vw， Wa Mae 必然 是 连通 的 , A 
此 属于 相同 的 集会 . 
固然 , 将 边 排序 可 便于 选取 , 不过, 用 线性 时 间 建 立 一 个 堆 则 是 更 好 的 起 法 此 时 ， 
DelereMin 将 使 得 边 依 序 得 到 测试 。 典型 情况 下 . 在 算法 终止 前 只 有 一 小 部 分 边 需 要 测 这 ， he 
mter t bb iris A v ERE. 例如, 假设 还 有 一 个 项 点 vs 以 及 值 为 100 的 边 ( us, ve). BS 


那么 所 有 的 边 就 会 都 要 考察 到 ,图 9-58 PHK Kukal 可 以 找 出 一 棵 最 小 生成 树 ， 因 为 一 条 n 
浪 出 三 部 分 数据 组 成 ， 所 以 在 某 些 机 器 上 把 优先 队 刻 实现 成 指向 边 的 指针 数组 比 实现 成 边 的 数 13181 


组 更 为 有 效 。 这 种 实现 的 效果 在 于 , 为 重新 排列 堆 ,需要 移动 的 只 有 那些 指针 ， 而 大 量 的 记录 划 
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void 
Kruskal( Graph G } 
i 


tnt EdgesAccepted; 
DisjSet 5; 
PriorityQueue H; 
Vertex U, V; 
SetType Uset, V5set; 


Edge E; 
/* l*/ Initializet 5 J; 
"LE I ReadGraphIntoHeapArrayt ú, H 5; 
fe aes BuildHeap( H 3: 
f* 45 EdgesAccepted = 0; 
A 5*6 while( EdgesAccepted < NumVertex - I ) 
/* 6*/ © E = DeleteMin( H ); /* E = (U,V) */ 
f* PR Lset = Find( U, 5 X; 
f® arf Vset = Find( V, 5 ); 
!* orf ifC Uset != Vset ) 
1 
/* Accept the edge */ 
/*10*/ EdgesAccepted++; 


/*11*/ SetUnion( 5, USet, V*5et 3; | 
| | 


Po 
图 9-58 Kruskal GE BA (f 
该 算法 的 最 坏 情形 运行 时 间 为 OCLE log | EO, 它 受 堆 操作 控制 , 注意 . HE, = 
OC\V\2), 因此 这 个 运行 时 间 实 际 上 是 OC! Ej log, Vi). 在 实践 中 ， AES E oT ERE A 
指示 的 时 间 快 得 多 ， 


9.6 深度 优先 搜索 的 应 用 


深度 优先 搜索 (depth_first search) 是 对 先 序 遍历 (preorder traversal) 的 推广 。 我 们 从 某 个 顾 
Jos 开始 处 理 v, 然后 递归 地 遍历 所 有 与 v 邻接 的 顶点 。 加 果 这 种 过 程 是 对 一 棵 树 进 行 , 8b 
2. 由 于 |E| = OU VD, 因此 该 树 的 所 有 的 项 点 在 总 时 间 OUIE|) 内 都 将 被 系统 地 访问 
Al 如果 我 们 对 任意 的 图 行使 该 过 程 , 为 了 避免 图 我 们 需要 小 心 仔细 , 为 此 ， 当 我 们 访问 一 
个 顶点 v 的 时 候 , 由 于 我 们 当时 已 经 到 了 该 点 处 ， 因此 可 以 标记 该 点 是 访问 过 的 , 并 且 对 于 
尚未 被 标记 的 所 有 邻接 顶点 递归 调用 深度 优先 搜索 。 我们 假设 ,对 于 无 向 图, BRI ve, w) 
在 邻接 表 中 出 现 两 次 ; 一 次 是 (u， w), 另 一 次 是 (ww, v). 图 9-59 中 的 两 数 执行 一 次 深度 优 
先 搜 索 ( 此 外 绝对 什么 也 不 做 ),， 从 而 是 一 个 通用 风格 的 模板 : 











void 
Dfs( Vertex V ) 
i 


visited[ V ] = True; 

for each W adjacent to V 
fC WWisited~ W ] } 

DfsC WoO; 


图 9.59. ”深度 优先 搜索 模板 


(全 局 ) 布 尔 型 数组 Visited | | PGR EM false. 通过 只 对 那些 尚未 被 访问 的 节点 递归 调用 
eR E. 我 们 和 保证 不 会 隧 人 无 限 的 循环 : 如 采 疼 是 无 回 的 日 不 连通 , 或 是 有 同 的 但 非 踢 过 通 
H3. 这 种 方法 可 能 会 访问 不 到 其 些 节 所。 此 时 ,我 们 搜索 - TCRKTEBRIDBUTS 4. EA bx HD 
度 优先 遍 让 ,并 继续 这 个 过 程 直到 不 存在 未 标记 的 节点 为 止 。- 国 为 该 太 法 保证 每 一 条 边 只 
访问 一 次 , 所 以 只 要 使 用 邻接 表 , 则 技 行 志 历 的 总 时 间 就 是 口 (| 开 + [VIX 
9.6.1 无 向 图 

尤 向 图 是 连通 的 ， 当 岂 仅 当 从 和 任 一 季 点 间 始 的 深度 优先 搜索 访问 到 每 一 个 节点 . 因为 这 
项 测试 应 用 起 来 非常 容易 ， 所 以 我 们 将 假设 我 们 处 理 的 图 者 是 连 遂 的 ,如 采 它 们 不 连 遂 ， 那 
么 我 们 可以 找 出 所 有 的 连通 分 支 并 将 我 们 的 算法 依次 应 用 于 每 个 分 交 。 

作为 深度 优先 搜索 的 一 个 例子 , RER 9-60 的 图 中 我 们 从 A 点 开始 . 此 时 , fick A 为 
访问 过 的 并 递归 调用 Djs (8B) DACAR B 为 访问 过 的 并 递归 调用 DCC)。DARCC) 标 记 
C Aye st MISTS DGD). Dis DRR A $0 B, 但 是 这 了 两 个 节点 部 已 经 被 访问 过 
了 了 .因此 设 有 递归 调用 盯 以 进行 。D 记 1D) 也 看 到 C 是 邻接 的 顶点 , Cw co, Ne 
在 这 里 也 没有 递归 调用 进行 ,于 是 DE(D) 返 加 到 DCC). DA(C)aE B ESIS, AM 
€. 并 发 现 以 前 设 看 见 的 顶点 E 也 是 邻接 点 ,因此 调用 DCE). DELIEY E 作 标 记 , 忽略 
ARC, JE Bl] DACC). PRIOC) 返 回 到 D&B). Df5CB)AUBR A AD 3E3& Il. Dfs CA) 
2 DAE 旦 返回 (我 们 实际 上 已 经 接触 每 条 边 两 次 , KEERAB, w), P-E 
*nGe, v), 但 这 实际 上 是 每 个 邻接 表 项 接触 一 次 。} 


a 





9-60 一 个 无 向 图 


我 们 以 图 形 来 描述 深度 优先 生成 树 (depth-first spanning tree} 的 步骤 , 该 树 的 根 是 A, JE 
第 -个 被 访 疝 到 的 项 点 。 图 中 的 每 LEXICO. we EB ITE b. 如 果 当 我 们 处 理 (v, ew DT 
发 现 ww 是 未 被 标记 的 , BARMA w, ww) 时 发 现 是 本 标记 的 ， 那么 我 们 就 用 树 的 一 -条 
JADRE. 如果 当 我 们 处 理 (w, wR w 已 被 标记 , HE ARNAR w, v) AE v tE 
已 有 标记 , 那么 我 们 就 画 一 条 虚线 ,并 称 之 为 背 向 边 (back edge), Ix I” CR ERE 
树 的 一 部 分 , 图 9-60 中 的 图 的 深度 优先 搜索 在 图 9-61 HRH- 


oo 其 实现 的 一 种 有 效 方 法 是 从 v, 开 巡 深度 优先 捧 索 - 如 果 我 们 需要 重新 升 冶 深度 优先 搜索 , 则 考虑 一 个 末 怀 记 的 
硕 点 序 到 oy, wyey AP 让- 是 最 后 - -次 深度 优先 搜索 开始 的 而 成 。 这 保证 整个 算法 只 花费 OCEV DRE RAE E 
那些 使 新 的 深度 优先 搜索 树 开始 的 项 以 
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(324, 图 961 上 图 的 深度 优先 搜索 


树 将 模拟 我 们 执行 的 遍历 。 只 使 用 树 的 边 对 该 树 的 先 序 编号 告 沂 我 们 这 些 灰 点 被 标记 的 
MERE. 如果 图 不 是 连通 的 , 那么 外 理 所 有 的 节点 (和 边 ) 则 沉 贤 多 次 调用 Dfs, 每 次 都 生成 一 标 
pj. 整个 集合 就 是 深度 优先 生成 森林 {depth-first spanning forest). 

9.6.2 Xie 

如 果 一 个 连通 的 无 向 图 中 的 任 一 原点 删除 之 后 , 剩 下 的 图 仍然 连通 , 那么 这 样 的 无 向 连 
遂 图 就 称 为 是 双 连 通 的 (biconnected)。 上 例 中 的 图 是 冯 连 通 的 。 WRAP OBS aL, 
JEE, 那么 , 车 大 任 一 台 计 算 机 出 故障 而 不 能 运行 , 则 网 络 邮 件 并 不 受 影响 ， CHER, 与 这 
台 坏 计算 机 有 关 的 邮件 除外 。 类 似 地 ， 如 果 一 个 公共 运输 系统 是 双 连 通 的 , EA, BR 
点 被 破坏 , 则 用 户 总 可 选择 另外 的 旅行 路 径 。 

如果-- 个 图 不 是 双 连 通 的 , 那么 , 将 其 删除 后 图 将 不 再 连通 的 那些 项 点 叫 做 割 点 (artieu- 
lation point), 这些 节点 在 许多 应 用 中 是 很 芋 要 的 。 图 9-62 中 的 图 不 是 双 连 通 的 : MA CHAD 
是 割 点 . 删除 顶点 C 使 图 G 不 连通 ,而 删除 质点 D 则 使 E 和 下 从 图 G 的 其 余部 分 断 离 





图 9-62 有 具有 市 点 CADRE 


深度 优先 搜索 提供 一 种 找 出 连通 图 中 的 所 有 制 点 的 线性 时 间 算法 。 首 先 ,， 其 图 中 任 一 而 
点 开始 ,执行 深度 优先 搜索 并 在 顶点 被 访问 时 给 它们 编号 。 对 于 每 一 个 顶点? 我 们 称 其 先 序 


编号 为 Num (oe). 然后 ,对 于 深度 优先 搜索 生成 树 上 的 每 一 个 项 总 v. 计算 编号 最 低 的 项 点 ， 
我 们 称 之 为 lowly). 该 点 从 o 开始, 通过 树 的 寒 条 或 多 条 边 末 可 能 还 有 一 条 背 癌 边 厢 (以 
该 序 ) 达 到 图 9-63 中 的 深度 优先 搜索 树 首先 指出 先 厅 编号 ,然后 指出 在 上 述 法 则 下 可 达到 
的 最 低 凡 号 玩 点 。 


a [ES | 


F, 6/4 


ND 
图 9.63 上 图 的 深度 优先 树 , 节点 宗 有 Nam A Low 


MA. BFC 和 天 始 的 可 达到 最 低 编号 项 点 为 1(A), 因为 它们 都 能 够 通过 树 的 边 到 D, 
RSH REY ems A. 我 们 可 以 通过 对 该 深度 优先 生成 树 执 4 r— Ua RAAE RR 
出 Lows 根据 low ETH Low (vu) iE 

I. Num(v) 

2. BH EIL AC v, w) PARI Nem Co) 

3, 树 的 所 有 边 (w，w') 中 的 最 低 Lowlw) 
中 的 最 小 者 . 

第 -个 条 件 是 不 选取 边 , 第 二 种 方法 是 不 选取 树 的 边 而 是 选取 一 条 痛 辐 过， 第 三 种 方法 
则 是 选择 树 的 某 些 边 以 及 可 能 还 有 一 条 此 向 迪 : 第 三 种 方法 可 用 一 个 递归 调用 简明 地 描述 。 
AFROS ES vo 的 所 有 儿子 计算 出 Lose 值 后 才能 计算 Low(w), 因此 这 是 一 个 后 序 明 用 。 
ah FH AMICO, w), 我 们 只 要 检查 Num (0 Al Num ta 就 可 以 知道 它 是 树 的 一 条 这 还 是 
ORR. 因此 ，Low (o ARP: fedi cie dli ”的 邻接 表 , 应 用 适当 的 法 则 ,并 记 住 
最 小 值 - 所 有 的 计算 化 费 OCELI + voj. 

剩 下 此 做 的 就 是 利用 这 些 信 息 找 出 所 有 的 制 点 根 是 割 点 当 且 仅 当 它 有 多 于 一 个 的 几 
Xo 因为 如 果 它 有 两 个 儿子 , 那么 删除 根 则 使 得 节点 相连 通 而 分 布 在 不 同 的 子 树 上 ; 如 采 根 7 
口 右 一 个 儿子 , 那么 除去 该 根 只 不 过 是 断 离 该 根 。 对 于 任何 其 他 顶点 v. CASES a 
CET JUT w (EIB Low (we Numo) 注意 , 这 个 条 件 在 根 处 总 是 满足 的 ; 内 此 , 市 要 i323) 


进行 特别 的 测试 。 

当 我 位 考查 算法 确定 的 割 点 . 即 CADE, 证 明 的 "( 当 ) 部 分 是 明显 的 . D 有 一 个 儿 
TE, H LowCEXZNum(D), 二 者 都 是 4. 因此 , 对 三 来 说 只 有 一 种 方法 到 达 刀 上面 的 任 
何 一 点 , 那 就 是 要 通过 D. 类 伏地 ，C 也 是 一 个 割 点 , 因为 Low (G)2Num(C)o 为 了 证 明 
该 算法 正确 , 我 们 必须 证 明 论 断 的 only if*( 仅 当 ) 部 分 成 立 ( 即 , 它 找到 所 有 的 割 点 )。 我 们 把 
它 留 作 一 道 练习 。 作为 第 二 个 例子 , 我 们 指出 (图 9-64) 同 样 在 这 个 图 上 应 用 该 算法 在 顶 /i C 
开始 深度 优先 搜索 的 结果 ， 





图 9 64 在 如 开始 深度 优先 搜索 所 得 到 的 深度 优先 树 


最 后 , 我 们 给 出 盆 代 码 实现 该 算法 ; 为 使 程序 简单 设 数组 Visited [ ] (初始 化 为 false) . 
Num |. Low[ ] 和 Parent ] 为 全 局 变量 。 我 们 还 有 一 个 全 局 变量 叫做 Counter, NAIF 
历 编 号 Nam[] 赋 值 , 将 Counter 初始 化 为 下 通常 这 在 实践 中 不 是 一 个 好 的 程序 证 计 , 不过， 
包含 所 有 的 声明 和 传递 那些 额外 的 参数 将 会 模糊 程序 的 逻辑 结构 - 我 们 还 将 省 略 对 根 的 容易 
实现 的 测试 。 

正如 我 们 已 经 提 到 的 , 该 算法 可 以 通过 执行 :次 先 序 遍 历 计算 Num Te FE38 I 
计算 Low KEM, 第 二 趟 遍历 可 以 用 来 检验 哪些 顶点 满足 割 点 的 标准 - 然而 ,执行 三 由 遇 历 
是 一 种 浪费 。 第 一 趟 在 图 9-65 PRE: 


/* Assign Num and compute Parents */ 


void 
AssignNum( Vertex V ) 
{ 


Vertex W; 
Num V ] = Counter++; 


Visited[ V ] = True; 
for each W adjacent to V 


ifC IVisited[ W ] 2 
| 
Parent[ W ] = V; 
AssignNum( W ?; 
; 





9-65 ”对 顶点 的 Nam 赋值 的 例 程 ( 伪 代 码 】 


AS = Bie bh aR Fa, 可 以 通过 图 9-66 中 的 代码 来 实现 , 第 8 行 处 理 一 个 
FERAL. 如果 w BEF v, 那么 递归 再 用 w HERR o PEI veu DX AE AXE BIS, 而 
只 是 ACAPELA RARA. BU, BRIA Low [| A Num! LER Ree, 
TE NTR AE ADE 





/* Assign Low; also check for articulation points */ 


vnid 
| Assignlowt Vertex V } 


| Vertex Wi; 
| f* 1*4 Low V ] = Num[ V ]; /* Rule 1 */ 
D ft pe for each W adjacent to V 
| 

| f* Pf ift Num W ) > Num[ V 13 /* Forward edge */ 
1 
| FU AFF AssignlLow{ W 3; 
l ff Sn, ift Low[ Wo] >= Num[ V ] ) 
i ft Br printf( "Xv is an articulation poinatyn", v 2; 
| f® yy Low[ V ] = Mint Low[ V F], Low[ W ] 3; /* Rule 3 */ 
} 
| else 

A Be if( Parent] V ] l= W) /* Back edge */ 


图 9-66 计算 Low FERET n BO CR COLE EH Fr ) 


RETNA- n Re SP 在 递归 调用 前 和 递归 调用 后 者 有 可 |， 
rm 


能 对 两 者 进行 处 理 , 图 9-67 中 的 过 程 将 两 个 例 程 AssignNum 和 AssignLow 结合 成 一 种 育 接 
的 方式 得 到 了 晴 数 FindArt。 




















void 
FindArt€ Vertex V j 
{ 


| Vertex W: 


| 
/* d*j Visited[ V ] = True; 
ft anf Low[ V ] = Num[ V ] = Counter++; /* Rule i ¥ 
/* 3*/ for each W adjacent to V 
1 
ft A*S ifC IVisited[ W 3 3  /* Forward edge */ 
i 
Q /* of Parent[ W ] = V; 
| A Ge FindAÁrt( W 3; 
f? ii ift bowl W ] >= Numi V J J 
f* Be printf( "Xv is an articulation point\n", v 2; 
A 9*7 Low[ V ] = Ming Low[ V J, Low[ W ] 2; /* Rule 3 uf 
} 
else 
f° 1d iff Parent[ V ] != Ww) /* Back edge +7 


Lowl v ] = Mint Low[ V 1, Num[ W j 5»: /* Rule 2 */ 


图 9.67 在 一 次 深度 优先 搜索 (忽略 对 根 的 检测 ) 中 对 割 点 的 检测 ( 伪 代 但 ) 


9.6.3 欧 拉 回路 
考虑 图 9-68 中 的 三 个 图 。 一 个 流行 的 游戏 是 用 钢笔 重 本 这 些 图 , 每 条 线 恰 好 画 一 次 。 在 
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到 图 的 时 候 钢笔 不 要 从 纸 上 离 开 : 作为 一 个 附加 的 问题 ， 雪 在 结束 男 图 时 , 使 钢笔 名 到 开始 
画图 时 的 起 点 上 。 沪 游戏 有 一 个 非常 简单 的 解法 . 如 果 你 想 尝 试 求解 该 问题 , 那么 现在 就 可 
以 试 -一 试 - 





图 9-68 =a BS 


SS AREA FARA PF AT Ch, 而 且 不 可 能 结 来 在 起 点 处 , 第 二 个 图 
"Eu. 它 的 终止 点 和 起 点 相同 , 但 是 , 第 三 个 图 在 游戏 的 限制 条 件 下 根本 画 不 出 来 . 

我 们 可 以 道 过 给 每 个 交点 指定 -- 个 项 点 而 把 这 个 问题 转化 成 图 论 问题 。 此 时 ， 图 的 近 可 
以 自然 的 方式 规定 ， 如 图 9-69, 


9.60 sip Hon 


将 问题 转化 之 后 ,我们 必须 在 图 中 找 出 一 条 路 径 , 使 得 该 路 径 对 图 的 每 条 边 怡 好 访问 一 
次 。 如 果 我 们 要 解决 “附加 的 问题 ", 那么 我 们 就 必须 找到 一 个 隐 , 该 圈 怡 好 经 过 每 条 边 一 次 。 
这 种 图 论 问题 在 1736 年 由 欧 拉 解 决 , 它 标志 着 图 论 的 诞生 。 根据 特定 问题 的 叙述 不 同 , 这 种 
问题 道 常 时 做 欧 拉 路 径 (Euler path， 有 了 时 称 欧 拉 环 游 Euler tour) 或 欧 拉 回路 (Euler cir- 
uity 问 题 。 虽 然 欧 拉 环 游 和 欧 拉 回 路 问题 稍 有 不 同 , 但 是 却 有 相同 的 基本 解 。 PRICE - 
节 我 们 将 考虑 欧 拉 回路 问题 。 

能 通 做 的 第 一 个 观察 是 , 其 终点 必须 终止 在 起 点 上 的 欧 拉 回路 只 有 当 图 是 连通 的 并 朋 每 
As iis BORE CRD, 边 的 条 数 } 是 偶数 时 才 有 可 能 存在 , 这 是 因为 ,在 欧 拉 回 路 中 ， 一 个 需 点 有 
ORLA, 则 必然 有 过 离开 。 如 果 任 -顶点 o 的 度 为 奇数 ,那么 实际 上 我 们 早晚 将 会 达到 这 样 
_ .种 地 步 , 即 只 有 一 条 进入 o 的 边 尚 未 访问 到 , 若 沿 该 边 进入 ”点 ， 那么 我 们 只 能 停 存 顶 战 
*， 不 可 能 再 出 来 。 姐 果 怡 好 有 两 个 顶点 的 度 是 奇数 ,那么 当 我 们 从 一 个 奇数 度 的 顶点 出 受 
最 后 终止 在 另 一 个 奇数 度 的 项 点 时 ,仍然 有 可 能 得 到 一 个 欧 接 环 游 。 这 里 ， 欧 拉 环 游 是 必须 
访问 图 的 每 一 边 但 最 后 不 一 定 必须 回 到 起 点 的 路 径 。 如果 奇数 度 的 项 点 多 于 两 个 , EZ CE 
环 游 也 是 不 可 能 存在 的 。 

上 一 段 的 观察 给 我 们 提供 了 欧 拉 回路 在 在 的 一 个 必要 条 件 。 不 过 ， 它 并 未 告诉 我 们 满足 
该 性 质 的 所 有 的 连通 图 必然 有 一 个 欧 拉 回路 , 也 没有 指 导 我 们 如 何 找 出 欧 拉 回路 。 事实 上 ， 
这 个 必要 条 件 也 是 充分 的 - 就 是 说 ， 所 有 顶点 的 度 均 为 偶数 的 任何 连通 图 必然 有 了 欧 拉 回路 。 
不 仅 如 此 ， 我 们 还 可 以 以 线性 时 间 找 出 这 样 - :条 回路 - 

由 于 我 们 可 以 用 线性 时 间 检 测 这 个 充分 必要 条 件 ， 因此 可 以 假设 我 们 知道 存在 一 条 欧 拉 
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回路 ,此 时 ， 上 基本 算法 就 是 执行 - :次 次 度 优 先 搜索 。 有 大 量 “ 明 显 的 "解决 廊 案 但 是 却 都 行 不 
gH. 我 们 罗列 了 一 些 在 练习 中 。 

主要 问题 在 于 ， 我 们 可 能 只 访问 了 图 的 一 -部 分 而 提前 返回 到 起 点 . 如 果 从 起 点 出 发 的 所 
Su AS, 那么 图 中 就 会 有 的 部 分 注 历 不 到 . 最 容易 的 补救 方法 是 找 出 有 汕 林 访问 的 边 
的 路 径 上 的 第 一 个 项 点, 并 执行 男 外 一 -次 深度 优先 搜索 . 这 将 给 出 另外 一 个 回路 ,把 它 拼 接 
到 原来 的 回路 上 。 继续 该 过 程 自 到 所 有 的 边 邦 被 遍历 到 为 止 - 

作为 一 个 例子 , 考虑 图 9-70 中 的 图 , 容易 看 出 , 这 个 岗 有 一 个 欧 拉 回路 。 设 从 顶点 5 开 
始 , 我 们 遍历 5.4、10、5， 此 时 我 们 已 无 路 可 走 ， 图 的 大 部 分 都 还 未 记 认 到 - 情况 如 图 9-71 
所 示 。 





图 9-70 欧 拉 回 路 问题 的 图 





E] 9.71. 遍历 $, 4, 10. 5 后 剩 下 的 图 


此 时 ,我们 从 顶点 4 继续 进行 , 它 仍 然 还 有 没 用 到 的 边 。 AR, MPR 4, 1,3, 7, 
4. 11 10, 7, 9, 3, 4。 如 果 我 们 把 这 条 路 径 革 接 到 前 面 的 路 径 5, 4, 10. 5 E, WARME 
到 一 条 新 的 路 径 5, 4, 1, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, 5. 

此 后 , 剩 下 的 图 表示 在 图 9-72 中 , 注意 , 在 这 个 图 中 ， 所 有 的 顶点 的 度 必 然 都 是 偶数 ， 
因此 、 我 们 保证 能 够 找到 一 个 图 再 拼接 上 . 剩 下 的 图 可 能 不 中 连通 的 , 但 这 并 不 重要 。 路 径 
上 存 有 未 被 访问 的 过 的 下 一 个 顶点 是 3。 此 叶 可 能 的 回路 可 以 是 3，2，8，9，6，3s 当 拼 接 进 
来 之 后 , 我 们 得 到 路 径 5, 4, 1, 3, 2, 8. 9, 6, 3, 7, 4, 11, 10, 7, 9, 3, 4, 10, 5e 


9 





图 972 385035, 4, 1, 3. 7, 4, 11. 10. 7, 9. 3, 4. 10, 5 后 的 图 
简 下 的 图 在 图 9-73 中 , EARE, AARET T DR ES JE 9, Y eH gg 9, 


E oF 
12, 10, 9。 当 把 它 拼接 到 当前 路 径 中 时 , 我 们 得 到 回路 5, 4, 1, 3, 2, 8, 9. 12, 10, 9, 6, 3, 7, 
4, ti, 10, 7, 9, 3, 4, 10, 5。 当 所 有 的 边 都 被 遍历 叶 , 算法 终 耻 ,我 们 得 到 一 个 欧 拉 思路 : 


© 
o © (5 G) 
Q > o 中 
Q3 


Ej 9.73. HERES 55,4, 1, 3, 2. 8. 9, 6. 3, 7, 4, 11, 10, 7. 9. 3, 4, 10. 5 Js] Pia 


为 合算 法 更 有 效 ， 必 须 使 用 适当 的 数据 结构 。 我 们 将 概述 想法 而 把 实现 方法 留 作 练习 。 
为 使 拼接 简单 ， 应 该 把 路 径 作 为 一 个 链表 保留 。 为 避免 车 复 拉 描 邻接 表 . UTR TREK 
我 们 必须 保留 一 个 指名 最 后 扫描 到 的 过 的 指针 。 当 拼接 进 一 个 路 径 时 , 必须 外 拼接 点 开始 提 
索 新 顶点 ,从 这 个 新 顶点 进行 下 一 轮 深度 优先 搜索 。 这 将 保证 在 整个 算法 期 间 对 顶点 搜索 阶 
段 所 进行 的 全 部 工作 量 为 O(|EE|1)。 使 用 适当 的 数据 结构 ,算法 的 运作 时 间 为 
OE! + [Vl 

— ^ AE2E AELTEL B5 I6] CR ES 93 PL nj SH PT RA BR 这 个 
问题 称 为 哈密 汞 顿 图 问题 {Hamiltonian cycle problem) : 虽然 看 起 来 这 个 问题 似乎 差不多 和 和 欧 
拉 回 路 问题 一 样 , 但 是 , 对 它 却 没 有 已 知 的 有 效 算法 . 我 们 将 在 9.7 节 中 再 次 看 到 这 个 问题 . 
9.6.4 有 向 图 

利用 与 无 向 图 相同 的 思路 ,也 可 以 通过 深度 优先 搜索 以 线性 时 间 届 上 由 有 加 图 - QR P 
是 强 连 通 的 ,那么 从 某 个 节点 开始 的 深度 优先 搜索 可 能 访问 不 了 所 有 的 节点 。 在 这 种 情况 下 
我 们 在 某 个 未 作 标 记 的 节点 处 开始 , 反复 执行 深度 优先 搜索 ,直到 所 有 的 节点 都 被 访问 到 ， 
作为 例子 ,考虑 图 9-74 FHASA. 








图 9-74 一 个 有 向 图 


我 们 在 项 点 B 任意 开始 深度 优先 搜索 。 它 访问 顶点 B, C, A, D, E RIF. Rii, fe 
个 未 访问 的 顶点 再 重新 开始 。 我 们 任意 地 选择 在 H 开始 , 访问 PRU. 最 后 , E G SOFAS 
它 是 最 后 一 个 需要 访问 的 顶点 。 对 应 的 深度 优先 搜索 树 如 图 9-75 中 所 不。 
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深度 优先 生成 森林 中 虚线 箭 法 是 UJÉ(Co, we, RPM we 在 考查 时 已 经 作 了 标记 。 让 无 
向 图 中 , 它们 总 是 一 些 背 向 边 , 但 是 我 们 可 以 看 到 , 存在 三 种 类 型 的 边 并 不 通 问 新 的 顶点 。 首 先 
dS aA, DMC, H) ATE RT forward edee) 如 CC， 了 D) 和 (0 E), 它们 从 
树 的 一 个 节点 通 向 一 个 后 裔 . 最 后 就 是 一 些 交 义 边 ， 如 (下 ,中 和 和 (如, F), 它们 把 不 直接 相关 的 
两 个 树 节 点 连接 起 来 。 深度 优先 搜索 森林 一 般 通 过 把 一 些 子 节点 和 一 些 新 的 树 从 左 到 右 浴 加 到 
森林 中 形成 。 在 以 这 种 方式 构成 的 有 向 图 的 深度 优先 搜索 中 , 交叉 边 总 是 从 右 到 左 行进 的 。 

有 些 使 用 深度 优先 搜索 的 算法 需要 人 区别 非 树 边 的 三 种 类 型 。 当 进行 深度 优先 搜索 时 这 是 
容易 检验 的 , 我 们 把 它 留 作 一 道 练习 。 

TEE WEARER PARES EIA, AW: 一 个 有 同 留 是 无 
圈 图 当 且 仅 当 它 没有 普 向 边 。( 上 面 的 图 有 背 向 边 ， 因 此 它 不 是 无 圈 图 。) 读 者 可 能 还 记得 ， 
拓扑 排序 也 可 以 用 来 确定 一 个 图 是 舍 是 无 网 图 . 进行 拓扑 排序 的 另 一 种 方法 是 通过 深度 优 所 
牛 成 森林 的 后 序 澳 历 给 顶点 指定 拓扑 编号 N，N - 1, …, 1。 只 要 图 是 无 图 的 , 这 种 排序 就 是 
— Sit B a 
9.65 查找 强 分 支 

通过 执行 两 次 深度 优先 搜索 , 我 们 可 以 检测 一 个 有 向 图 是 否 是 强 连 通 的 , WR EDER 
连通 的 ,那么 我 们 实际 上 可 以 得 到 顶点 的 一 些 子 集 , 它们 到 其 自身 是 强 连通 的 . xx Urn ELA 
用 一 次 深度 优先 搜索 做 到 , 不 过 , 此 处 所 使 用 的 方法 理解 起 来 要 简单 得 多 .。 

首先 , 在 输入 的 图 G 上 执行 一 次 深度 优先 搜索 ,通过 对 深度 优先 生成 森林 的 后 序 遍 历 将 
G 的 顶点 编号 , 然后 再 把 G 的 所 有 的 边 反 向 , 形成 Ge 图 9-76 中 的 图 代表 图 9-74 所 示 的 图 


该 算法 通过 对 6, 执行 一 次 深度 优先 搜索 而 完成 ,总 蚌 在 编号 最 高 的 项 点 开始 一 次 新 的 
深度 优先 搜索 。 TE, 我们 在 顶点 G 开始 对 G, 的 深度 优先 搜索 ，G 的 编号 为 10, IEEE Ds 
不 通 问 任何 顶点 , 因此 下 一 次 搜索 在 H 点 开始 。 这 次 调用 访问 [和 J。 下 一 次 调用 仁 B SOT 
ILIA, CAF. 此 后 的 调用 是 Djs(DD) 及 最 终 调用 DAE) 结果 得 到 的 深度 优先 生成 
森林 如 图 9-77 PATA. 

在 该 深度 优先 生成 森林 中 的 每 棵 树 ( 如 果 完 全 忽略 所 有 的 非 树 边 , 那么 这 是 很 容易 看 出 
的 ) 形 成 一 个 强 连通 的 分 支 。 因此 ,对 于 我 们 的 例子 , 这 些 强 连 通 分 支 为 {G1, 1H, 1, JI. 
HB, A. C, Fi, IDI 和 MIE!, 

为 了 理解 该 算法 为 什么 成 立 , 首先 注意 到 ， 如 里 两 个 借 点 o 和 ww 都 在 同一 个 强 连通 分 文 
中 .那么 在 原 图 G 中 就 存在 从 v Elw 的 路 和 和 从 w Slo IRIS, A, 在 G, 中 也 存在 现 
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O77 C, 的 深度 优先 搜索 - BoA Ga HLT. 1B, A, C, ESL DIS EI 


人 在， 如果 两 个 顶点 oue TEG 的 同一 个 深度 优先 生成 树 中 . 那么 显然 它们 也 不 可 能 在 同 
一 个 强 连 通 分 文中 . 

为 了 证 明 该 算法 成 立 , 我 们 必须 指出 ， 姑 时 两 个 顶点 v fw 4G, 的 同一 个 深度 优先 午 
成 树 中 , 那么 必然 存在 从 v Blu DREAM w Be RE. 等 价 地 ， 我 们 可 以 证 明 , 如 果 x 
是 G, 包含 w 的 深度 优先 生成 树 的 根 , 那么 存在 -- 条 从 工 到 z MA v 到 > 的 路 径 。 对 w MH 
相同 的 推理 则 得 到 一 -条 从 e 到 tw MA w Be 的 路 径 。 这 些 路 径 则 意味 善 那些 从 v Bl o 和 从 
w 到 vw( 经 过 2 RE- 

HF ov Er EG, 的 深度 优先 生成 树 中 的 一 个 后 裔 , 内 此 存在 G, 中 一 条 从 工 Po 的 路 
从 ,从 而 存在 C 中 一 条 从 Sle 的 路 径 . 此 外 , 由 于 x EUR. 因此 > BOB MOX RE DEC 
搜索 得 刘 更 高 的 后 序 编 号 。 于 是 ， 在 第 一 次 深度 优先 搜索 期 间 所 有 处 理 o 的 工作 都 在 z 的 工 
作 结 束 前 完成 。 既然 存 在 一 条 从 v Blo 的 路 径 , 因此 > 必然 是 x 在 G 的 生成 树 中 的 一 个 后 裔 
GW 将 在 x 之 后 结束 。 这 意味 着 GC 中 从 上 到 v 有 一 条 路 径 , 证 明 完成 : 


9.7 NEPE- 完全 性 介绍 


在 这 - 章 , 我 们 已 经 看 到 各 种 各 样 图 论 问题 的 解法 。 所 有 这 些 问题 都 有 一 个 多 项 式 运 行 
Fi ， 除 网 络 流 问题 外 , 运行 时 间或 考 是 线性 的 , 或 者 稍微 比 线性 多 一 些 (D(IE log ED). 
顺 醒 指出 ,我 们 还 提 到 ,对 于 某 些 问题 ,有些 变 化 似乎 比 原始 问题 要 困难 . 

器 忆 欧 拉 回 路 问题 , 它 朗 求 找 出 一 条 路 径 恰 好 经 过 每 条 边 一 次 ,该 问题 是 线性 时 间 要 蚀 
的 .哈密 尔 顿 图 问题 理 找 一 个 简单 轿 ,该 天 包含 每 一 个 项 点。 对 于 这 个 问题 ， 尚 不 知道 有 线 





对 于 有 向 图 的 单 发 点 无 权 最 短路 答 问 题 也 是 线性 时 间 可 解 的 , 但 对 应 的 最 长 简单 路 径 问 
ff Clongest-simple-path ) 83 4+ 14] ZR EAN TH] PERE... 

REAT, ASB TEER TSR AY is EA, MIT pute d Capo BUCPR AR TE 
算法 , MAA ETRE Sere Rz 380 IK, 这些 问题 的 一 些 熟 知 算法 对 于 共 此 输 
入 可 能 要 花费 指数 时 间 . 

在 这 一 节 , 我 们 将 简要 考查 这 种 问题 . 这 种 问题 是 相当 复 休 的, 因此 我 们 将 只 进行 快速 
和 非 正式 的 探讨 。 这样-- 来 . 我 们 的 讨论 可 能 (必然 地 ) 处 处 邦 或 多 或 少 因 不 准确 而 有 些 
BUER.. 

我 们 将 看 到 , 存在 大 基 重 要 的 问题 , 它们 在 复杂 性 上 大 体 是 等 价 的 。 这 些 问 题 形 成 一 个 
类 ,叫做 NP- 完 全 (NP-complete) 问 题 。 这 些 NP- 完全 问题 精确 的 复杂 度 仍然 需要 确定 并 且 在 
计算 机 理论 科学 方面 仍然 是 最 重要 的 开放 性 问题 , 要 么 所 有 这 些 问 题 有 和 多项式 时 间 解 法 , 要 
么 它们 都 设 有 多 项 式 时 间 解 法 : 

9.7.1 难 与 易 

在 给 问题 分 类 时 , 第 一 步 要 考虑 的 是 分 界 , 我 们 已经 看 到 , 许多 问题 可 以 用 线性 时 间 求 
解 . 我 们 还 看 到 某 些 O(logN) 的 运行 时 间 , 但 是 它们 要么 假定 已 做 某 些 预 处 理 ( 如 输入 数据 
已 读 人 或 数据 结构 已 建立 }, 要 么 出 现在 运算 实例 中 。 Bü, Ged ROAR RIK, SAT 
两 个 数 M 和 NN AY, 花费 O(logN} 时 间 .. 由 于 这 西 个 数 分 别 由 log M 和 logN 个 二 进 制 位 组 
He, 因此 Ged 算法 实际 上 花费 的 时 间 对 于 输入 数据 的 量 或 大 小 而 言 是 线性 的 。 由 此 相知， 当 
我 们 度量 运行 时 了 间 时 ,我 们 将 把 运行 时 间 考 虑 成 输入 数据 的 量 的 图 数 。 一 般 说 来 , 我们 不 能 
期 组 运行 时 间 比 线性 串 好 。 

noy, 确实 存在 某 些 真正 难 的 问题 . 这 些 问 题 是 如 此 的 难 ， 以 至 于 它们 不 可 能 解 出 : 
但 这 并 不 意味 着 只 能 发 出 叹息 , 期 待 天 才 来 求解 该 问题 。 正 如 实数 不 足以 表示 一 <0 的 解 屠 
样 , 可 以 证 明 ， 计算 机 不 可 能 解决 碰巧 发 生 的 每 一 个 问题 。 这 毕 “ 不 可 能 " 解 出 的 问题 是 做 不 
可 判定 问题 (undecidable problem). 

一 个 特殊 的 不 可 判定 问题 是 停机 问题 (halling problem) . 是 否 能 够 让 你 的 C 编译 器 拥有 
.个 附加 的 特性 ,， 即 不 仅 能 够 检查 语法 错误 , 是 且 还 能 够 检查 所 有 的 无 限 循 环 ? RT 
个 难 的 问题 , 但 是 我 们 或 许 期 望 , RULES BRP REE RE Be OT, 他 们 也 许 能 
各 编 制 出 这 种 增强 型 的 编译 央 。 

沪 问 题 是 不 可 判定 问题 的 直观 原因 在 于 , 这 样 一 个 程序 可 能 很 难 检查 它 目 已。 出 于 这 个 
WR, 有 时 这 些 问 题 叫做 是 素 归 不 可 判定 的 (rccursively undecidable) 5 

如 果 一 个 无 限 循环 检查 程序 能 够 号 出 ,那么 它 肯 定 可 以 用 于 自 检 。 此 时 我 们 可 以 制 震 一 
个 程序 叫做 LOOP. LOOP 把 一 个 程序 P 作为 输入 并 使 P 自身 运行 - SUR P É Eris 8E DR 
循环 ， 则 显示 短语 YES. WP P 自身 运行 时 终止 了 , 那么 自然 要 做 的 事 是 显示 NO. RIN 
么 做 的 办 法 是 , 我 们 将 让 LOOP 进入 一 个 无 限 循 坏 : 

" LOOP 将 自身 作为 输入 时 会 发 生 什 么 呢 ? 要 么 LOOP 停止 , BARE IES 问题 在 于 ， 
x RIT ARE SSOP, 与 短 诸 "这 句 话 是 一 句 谎言 产生 的 予 盾 大 致 相同 ， 

根据 我 们 的 定义 , 如果 POPE, 则 LOOP(P) 进 入 一 个 无 限 循环 eS P = LOOP 
B. PCP) ike Wet. 按照 LOOP 程序 . LOOP(P) 应 该 进入 一 个 无 限 循环 。 因此, 我 们 必须 
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让 LOOP(LOOP) 终 止 并 进 和 人 一 个 无 女 循 环 ， 显 然 这 是 不 可 能 的 - 另 一 方面 , 设 当 P = LOOP 
时 PP) 进 入 一 个 无 限 循 环 , 则 LOOP EAA, 面 我 们 得 到 同样 的 一 组 矛盾 。 因 此 , 我 
们 看 到 , 程序 LOOP 不 可 能 存在 。 

9.7.2 NP# 

NP ERE EXD A GY XE fe] BE. NP 代表 非 确定 型 多 项 式 时 间 {nondeterministie 
polynomial-time), 确定 型 机 髓 在 每 一 时 刻 部 在 执行 -- 条 指令 . 根据 这 条 指令 , 机 器 再 去 执行 
某 条 接 下 来 的 指令 , 这 是 惟一 确定 的 TU— £r E88 AE AS ULERON HUS BUzb DR CR ATEA, TE UI 
以 自由 进行 它 想 要 的 任意 的 选择 ,如 时 这些 后 面 的 步 又 中 有 一 条 导致 问题 的 解 , AEE 
是 选择 这 个 正确 的 步 台 ,因此 ， 非 确 定型 机 器 具有 非常 好 的 猜测 (优化 ) 能 力 : EE ER i 
奇怪 的 模型 ,因为 没有 人 能 够 构建 一 台 非 确定 型 计算 机 , 还 因为 这 台 机 器 是 对 标准 计算 机 的 
令 人 难以 置信 的 改进 (此 时 每 一 个 问题 都 变 成 易 解 的 了 )。 我 们 将 看 到 ， 非 确定 性 是 非 弟 有 用 
的 理论 结构 。 此 外 , 非 确定 性 也 不 像 人 们 想像 的 那么 强大 。 例如 , 即使 使 用 非 确 定性 , 不 可 判 
定 问题 仍然 还 是 不 可 判定 的 。 

恰 验 一 个 问题 是 否 属于 NP 的 简单 方法 是 用 “起 / 省 (yes/no) 问 题 "的 计 言 描述 该 问题 。 如 
果 我 们 存 多 项 式 时 间 内 能 够 证 明 一 个 问题 的 仁 意 “是 "的 实例 是 正确 的 , 那么 该 问题 属于 NP 
类, 我 们 不 必 担 心 “ 否 "的 实例 , 因为 程序 总 是 进行 正确 的 选 撑 。 因 此 , 对 于 哈密 尔 顿 网 问题 ， 
一 个 * 是 "的 实例 就 是 图 中 任意 一 个 包含 上 所 有 预 点 的 简单 的 回路 : 由 于 给 定 一 条 路 径 ， 和 验证 它 
是 否 真 的 是 哈密 尔 顿 图 是 一 件 简单 的 事情 ,因此 哈密 尔 顿 岁 问 题 属 于 NP 诸如” 仔 在 长 度 大 
I K 的 简单 路 径 吗 ? "这样 的 适当 的 问题 也 可 能 容易 验 让 从 而 属于 ND.» 满足 这 条 人 性质 的 任何 
路 径 均 可 容易 地 检验 

由 于 解 本 身 显 然 提 供 了 验证 方法 , 因此 , NP 类 包括 所 有 具有 多 项 式 时 间 解 的 问题 。 人们 
会 祖 到 ,既然 验证 一 个 答案 要 比 经 过 计算 提出 一 个 答案 容易 得 多 , 因此 在 NP 中 就 会 存在 不 
具有 多 项 式 时 间 解 法 的 问题 。 这 样 的 问题 至 今 没 有 发 现 , TE, 非 确 定性 并 不 是 如 此 重要 的 
改进 是 完全 有 可 能 的 , 尽管 有 些 专家 很 可 能 不 这 么 认为 。 问 题 在 于 , 证 明 指 数 下 界 是 一 项 极 
其 困难 的 工作 。 我 们 曾 用 来 证 明 排 序 需 要 OON. logN) 次 比较 的 信息 理论 定 淹 方法 似乎 还 不 
足以 完成 这 样 的 工作 ,因为 决策 树 都 还 不 足够 大 . 

还 要 注意 , 不 是 所 有 的 可 判定 问题 都 属于 NP. SRE TOE AA IRR ER IE) 
问题 .证 明 一 个 图 有 哈密 尔 顿 圈 是 相对 简单 的 一 件 事情 一 一 我 们 只 需 展 示 一 个 即 可 。 然而 部 
没有 人 知道 如 何以 多 项 式 时 间 证 明 一 个 图 没有 哈密 尔 顿 圈 : 似乎 人 们 只 能 校 举 所 有 的 网 并 且 
将 它们 一 个 一 个 地 验证 才 行 。 因 此 , 光 哈 密 尔 顿 轿 的 问题 不 知 属 不 属于 NP, 

9.7.3 所 P- 完 全 问题 

在 已 知 启 于 NP 的 所 有 问题 中 , 存在 一 个 子 集 ,叫做 NP- 完 全 (NP-complete) 问 题 , "EZ 
AY NP 中 景 难 的 间 题 。NP- 完 全 问题 有 一 个 性 质 , 妈 NP 中 的 任 -- 问 题 都 能 够 多 项 式 地 归 约 
成 NP- 完 全 问题 。 

一 个 问题 P, 可 以 归 约 成 问题 Ps 如 下 : BA- 个 映射 , EI Pi 85 4E fap SE BA AB n] LA SE 
成 P. 的 一 个 实例 。 求 解 P;， 然后 将 答案 上 映射 回 原始 的 解答 。 作为 一 个 例子 ， 考虑 把 数 以 上 
进 制 输入 划一 只 计算 器 。 将 这 些 十 进 制 数 转化 成 二 进 制 数 , 所 有 的 计算 都 用 二 进 制 进行 : 然 
后 ， 再 把 最 后 答案 转变 成 十 进 制 显示 .. 对 于 可 多 项 式 地 归 约 成 Pa 的 P, 与 变换 相 联 系 的 所 
有 的 工作 必然 以 多 项 式 时 间 完 成 。 
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NP- 完 全 门 题 是 最 难 的 NP 问题 的 壤 因 在 于 , 一 个 NP- 完 全 的 问题 基本 土 可 以 用 作 NP 中 
任何 癌 题 的 子 程序 , 其 花费 只 不 过 是 多 项 式 的 开销 量 。 因此 ,如果 任意 NP 完全 问题 有 一 个 
多 项 式 时 间 解 , 那么 NP 中 的 每 -- 个 问题 必然 都 有 一 个 多 项 式 时 间 的 解 . 这 使 得 NP 完全 问 
题 是 所 有 NP 问题 中 最 难 的 问题 . 

设 我 们 有 一 个 NP- 完 全 问题 P|, 并 设 P. 已 知 属 于 ND. 再 进一步 假设 DP, 多 项 式 地 归 约 
成 Po. 使 得 我 们 可 以 通过 使 用 P2 求解 P| 而 只 多 损耗 了 多 项 式 时 间 . 由 于 PI 是 NP- 完 全 
ij, NP 中 的 每 一 个 问题 都 可 和 多项式 地 归 约 成 Pi., 应 几 多 项 式 的 封闭 性 , RTA BI, NP 中 的 
每 一 个 问题 均 可 多 项 式 地 归 约 成 Pl: 我 们 把 问题 妇 约 成 Pi ,然后 再 把 PI 归 约 成 P,, 因此 ， 
P, 是 NP- 完全 的 。 

作为 - :个 例子 ,， 设 我 们 已 经 知道 哈密 尔 顿 圈 问 题 是 NP- 冠 全 问题 - 巡回 售货员 (travcling 
salesman problem) 问 题 如 下 。 

巡回 上 售货员 问题 : 

给 定 一 完全 图 G = (V, FE) 、 它 的 边 的 值 以 及 整数 K, 是 否 存 在 一 个 访问 所 有 顶 态 并 是 

BK 的 简单 图 ? 

这 个 何 题 不同 于 险 密 尔 顿 圈 问 题 , 因为 全 部 | VV 7 107 2 Se TE n HA EI 
EL. 该 问题 有 很 多 重要 的 应 用 。 例如 ， 印刷 电路 板 需 要 穿 - 些 孔 使 得 芯片、 电阻 喝 以 及 其 他 
的 电子 元 件 可 以 置信 。 这 是 可 以 机 械 完成 的 。 穿 孔 是 快速 的 操作 ; 时 间 耗 费 在 给 穿孔 器 定位 
上 ， 定 位 所 需要 的 时 间 依 赖 于 从 孔 到 我 间 行 进 的 距离 。 由 于 我 们 希望 给 每 一 个 孔 位 穿孔 ( 然 
后 返回 到 开始 位 置 以 便 给 下 一 块 电路 板 穿孔 ), 并 将 钻头 移动 所 耗费 的 总 时 间 限 制 到 最 小 ， 
内 此 我 们 得 到 的 是 一 个 洲 回 售货员 问题 。 

洲 回 售货员 问题 是 NP- 完 全 的 。 容易 看 到 ,其 解 可 以 用 多 项 式 时 间 检 验 ， 当然 它 属 于 
NP. 为 了 证 明 它 旦 NP_ 完 全 的 ,我 们 可 党 项 式 地 将 哈密 尔 顿 圈 国 题 归 约 为 好 加 此 货 员 问 题 : 
为 此 , 构造 一 个 新 的 图 GC, GHG 有 相同 的 顶点 。 对 于 Gc BIST AIC, w). WR, 
w)€Gc. 那么 它 就 有 权 1， BR, 它 的 权 就 是 2。 我们 选取 并 = | Vl. ME 9-78. 
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ANE. G5 e EORR BO GUB 1 BARA VAM e E BE ba BE fel 
BER 

WAC YES BBE NP 完全 的 问题 。 为 了 证 明 某 个 新 问题 是 NP- 完 全 的 ,必须 证 明 它 属 
NP, 然后 将 一 个 适当 的 NP- 元 问题 皮 换 到 该 问题 。 员 然 到 镶 回 售货员 问题 的 变换 是 相当 
简单 的 , 但是, 大 部 分 变换 实际 上 却 症 相当 复杂 的 , 需要 某 些 复杂 的 构造 , AR ES 
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TTAR NP- SEAR. 由 于 我 们 只 关注 一 般 的 想法 ， 
因此 也 就 不 再 讨论 更 多 的 变换 : 有 兴趣 的 读者 可 以 查阅 本 章 后 面 的 参 . 闻 文献 

细心 的 读者 可 能 想 知 道 第 -- 个 NP- 完 全 问题 是 如 何 有 具体 地 被 证 明 是 NP- 完 全 的 。 出 十 证 
HH- :个 问题 是 NP- 完 全 的 , 需要 从 邮 外 一 个 NE- 完 全 问题 变换 到 人 它 ,， 因 此 必然 存在 革 个 NP- 
完全 问题 , 对 于 这 个 问题 上 述 思 路 行 不 遂 。 第 一 个 被 证 明 是 NP- 完 全 的 问题 是 可 满足 性 (xsat- 
isfiability 8] E , 这 个 可 满足 性 问题 把 -- 个 布尔 珍 达 式 作 为 输入 并 提问 中 否 该 表达 式 对 式 中 各 
变量 的 一 次 赋值 取 值 1。 

可 满足 性 当然 属于 NP. RAAB ART Ha RIAA HARARE Eme). 
在 1971 F, Cook 通过 直接 让 明 NP 四 的 所 有 问题 部 二 以 变换 成 可 满足 性 问题 而 让 明了 机 满 
足 性 问题 是 NP- 完 全 的 。 为 此 , 他 用 到 了 对 NP 中 每 -一 个 问题 都 已 知 的 事实 : NP 中 的 得 :个 
问题 都 可 以 用 一 台 非 确定 型 计算 机 在 多 项 式 时 间 内 求解 .计算 机 的 一 个 形 坏 化 的 模型 称 作 图 
RHL Turing machine). Cook 指出 这 人 台 机 器 的 动作 如 何 能 够 用 一 个 极其 复杂 但 仍然 是 多 项 式 
的 元 长 的 布尔 公式 来 模拟 。 该 布尔 公式 为 真 ， 当 且 仪 当 由 图 如 机 运行 的 程序 对 其 输入 科 到 一 
个 “是 "的 答案 . 

一 旦 可 满足 性 被 证 明 是 NP- 完 全 的 , 则 一 大 批 新 的 NP- 完 全 问题 , Gud EUG ec HILOS [rn] 
题 ， 也 都 被 证 明 是 NP- 完 全 的 。 

除 可 满足 性 问题 外 , 我 们 已 经 考查 过 的 哈密 尔 顿 回路 问题 、 扩 回 和 售货员 和 问题、 最 长 路 径 
问题 都 是 NP- 完 全 问题 , 此 外 , 还 有 一 些 我 们 尚未 讨论 的 问题 如 装 箱 (bin packing) Fla. A 
(knapsack) 问 题 、 图 的 着 色 {graph coloring) 问题 以 及 图 (cliquc) 的 问题 者 是 普 名 的 NP-5£ 4 [n] 
题 。NP- 完 全 问题 相当 广泛 ,包括 来 自控 作 系 统 ( 调 度 和 安全)、 RHR B SUE. ER 
学 、 特 别 是 图 论 等 不 同 的 领域 的 问题 。 

总 结 

存 这 一 章 , 我 们 已经 看 到 图 如 何 用 米 给 出 许多 实际 和 牛 活 问题 的 模型 RR e 
是 非常 稀 玖 的 . 因此 , 注意 用 于 实现 这 些 图 的 数据 结构 很 下 要 。 

我 们 还 看 到 一 类 问题 , 它们 似乎 没有 有 有 效 的 解法 , 在 第 10 章 将 讨论 处 理 这 些 癌 题 的 茶 志 
方法 ， 
练习 

9.1 RER 9-79 的 一 个 拓扑 排序 . 
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QU HI— T RICE 9.1 节 中 拓扑 排 序 算法 的 队列 , 是否 得 到 不 问 的 排 子 ? 为 什么 - 
种 数据 结构 会 给 出 "更 好 "的 答案 ? 

编写 - -个 程序 执行 对 个 图 的 拓扑 排序 。 

使 用 标准 的 二 重 箱 坏 . - :个 邻接 赴 阵 仪 初始 化 就 需要 OOV]. Wte- -种 方法 
E 个 留存 鲜 在 一 个 邻接 算 阵 中 (使 香 测 试 一 条 过 是 和 否 存 村 花费 OCDE fe — X 
的 运行 时 间 。 

a. 找 出 图 9-80 中 图 的 A. 点 到 所 有 其 他 项 点 的 最 得 路 径 

b. 找 出 图 9-80 PRY B S s AAT H fü IUE a d e Bs JCTCER AE. 
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当 用 #4- 堆 实现 时 (6,5 12), Dijkstra 算法 最 坏 和 情形 的 运行 时 间 是 多 少 ? 

a. 给 出 在 有 -条 负 边 但 无 条 值 图 时 ,Dijkxtra 算法 得 到 错误 答案 的 例 于 - 

b. 证 明 , MRR AA, 则 9.3.3 段 中 提出 的 赋 权 有 最短 路径 算法 是 
成 立 的 ， 并 证 明 该 算法 的 运行 时 间 为 OUEL V1). 


设 一 个 图 的 所 有 边 的 权 都 中 在 1 ALE | 之 间 的 整数 。Dijkstra 算法 可 以 多 快 实现 ? 


9.10 a. 和 解释 如 何 修改 Dijkstra 算法 以 得 到 从 v Ble 的 不 同 的 最 小 路 从 的 个 数 的 计数 。 


9. Hl 
9.12 


9.13 


b. 解释 如 何 修改 Dijkstra 算法 使 得 如 果 存 在 多 于 一 条 从 v Blue 的 最 小 路 经 ,下 337] 
么 具有 最 少 边 数 的 路 径 将 被 选中 。 

找 出 图 9-79 中 的 网 络 的 最 大 流 。 

ibG = (v, FI) 是 一 棵 树 ，* ECHR, 并 用 添加 一 个 项 点 上 以 及 从 GG 中 所 有 树 

叶 到 t 的 无 穷 容量 的 边 , 给 出 一 AER TUUS Mos 到 z HAG. 

CAE G = CV, pum V 划分 成 两 个 子 集 Vi 和 V43f LLBD 899 DU 

pns -个 子 集 中 的 图 

a. id REDE -个 岗 是 各 是 二 分 图 : 

b. 一 分 匹配 问题 是 找 出 FF 的 最 大 子 集 E 使 得 没有 顶点 含 在 多 于 一 条 的 边 中 。 mg 
9-81 中 所 示 的 是 四 条 边 的 一 个 匹配 {由 虚线 表示 )。 存在 一 个 五 条 迪 的 匹配 ， 它 
是 最 太 的 匹配 
指出 二 盆 匹 配 问题 如 何 能 够 用 于 解决 下 列 问题 : 我 们 有 一 组 教师 、 一 组 课程 ， 
以 及 每 信教 师 有 资格 教授 的 课程 此 。 如 果 没 有 教师 需要 教授 多 于 一 门 的 谋 称 ， 


338. 
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而 且 只 有 一 公教 师 可 以 教授 一 门 给 定 的 课程 , 那么 可 以 提供 井 汪 的 赣 程 的 最 
p WR EM 
c. 证 一 阿 络 流 问 题 可 以 用 来 解决 二 分 匹配 问题 . 





ABest - -个 二 分 图 


9.14 给 出 -个 算法 找 出 和 容许 最 大 流通 过 的 增长 通路 。 
9.15 a. 使 用 Prim Al Kruskal 两 种 算法 求 出 图 9-82 中 图 的 最 小 生成 酸 。 
b. 这 棵 最 小 生成 树 是 惟一 的 吗 ? 为什么， 
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9.16 如 果 存 在 一 些 负 的 边 权 , 那么 Prim AER Kruskal 算法 还 能 行 得 通 吗 ? 

9.17 证 明 立 个 顶点 的 图 可 以 有 RR Ba DE aR 

9.18 编写 一 个 程序 实现 Kruskal 算法 。 

9.19 ”如 果 一 个 图 的 所 有 边 的 权 都 在 1 和 |E| 之 间 , 那么 能 有 多 快 算出 最 小 生成 树 * 
9.20 ”给 出 一 个 算法 求解 最 大 生成 衬 . 这 比 求解 最 小 和 牛 成 树 更 难 吗 ? 

9.21 求 出 图 9.83 中 图 的 所 有 割 点 。 指 出 深度 优先 生成 树 和 每 个 项 点 的 Num FI Low 的 值 。 





Hg gx 257 
9.22. 让 明 寻 找 割 点 的 算法 的 正确 性 。 
9.23 a. 给 出 一 种 算法 求 册 最 小 的 边 数 , 这 些 边 从 一 个 无 和 图 中 删除 后 应 使 所 得 的 图 是 
TAR. 
* b. 证 明 这 个 问题 对 有 向 图 是 NP- 完 全 的 。 
9.24 WFR: 在 一 个 有 问 图 的 深度 优先 生成 森林 中 所 有 的 释义 边 邦 址 从 右 到 左 的 . 
9.25 给 出 一 个 算法 以 雇 定 在 一 个 有 向 图 的 深度 优先 生成 森林 中 的 一 条 过 4a.、 wR 
EM, Wmv, «RMT. 
9.26 找 出 图 984 的 图 中 的 强 连通 分 支 . 
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9.27 编写 一 个 程序 以 技 出 一 个 有 向 图 的 强 连 通 分 支 。 

“9.28 给 出 一 个 算法 只 用 一 次 深度 优先 搜索 找 出 强 连通 分 支 来 。 使 用 类 人 于 双 连 通 性 算 
法 的 算法 。 

0.20 一 个 图 如 的 双 连 通 分 支 {biconmnected component ) Je JE. 352 7f kV; -- 些 集合 的 划分 , 使 
得 每 个 边 集 所 形成 的 图 是 双 连 通 的 .修改 图 9-67 中 的 算法 ,使 能 找 出 双 连 通 分 文 
Ti ee ER o 

9,30” 设 我 们 对 一 个 无 向 图 进行 广度 优先 搜索 (breadth-first search) FFM Sr — PRI ALA 
A/S Cbreadth-first spanning tree). 证明 该 档 所 有 的 边 要 么 是 树 边 要 人 么 是 这 


X Xj. 
9 31 给 出 一 个 算法 在 一 无 向 (连通 ) 图 中 找 出 一 条 路 答 使 其 在 每 个 方向 上 恰好 通过 每 条 
边 一 次 ， 


9.32 a. 编写 一 个 程序 以 找 出 一 个 图 中 的 一 条 歼 拉 回路 (如 果 闻 在 的 证 )。 
b. 编写 一 个 程序 以 找 出 一 个 图 中 的 一 条 欧 拉 环 游 (如 果 存 在 的 证 )。 

9.33 ”有 向 图 中 的 欧 拉 回路 是 一 个 图 , 该 图 中 的 每 条 过 恰好 被 访问 一 次 。 

x a. 证明: 有 向 图 有 欧 拉 回路 当 且 仅 当 它 是 强 连通 的 并 且 每 个 顶点 的 人 度 等 于 出 
度 。 
sb. 给 出 一 个 算法 以 在 存在 网 拉 同 路 的 有 向 图 中 找 出 一 条 欧 拉 回 路 。 

9.34 a. 考 虚 欧 拉 回 路 问题 的 下 列 解法 : 假设 一 个 图 是 双 连 通 的 。 执 行 一 次 深度 优先 搜 
索 , 只 在 万 不 得 已 的 时 候 使 用 背 向 边 。 如 果 图 不 是 双 连 遂 的 ， 则 对 双 连 通 分 文 
递归 地 应 用 该 算法 。 这 个 算法 行 得 通 吗 ? 

bp_ 设 当 用 到 背 向 边 时 我 们 取 用 连接 到 最 近 祖 先 节点 的 背 向 边 , WARRE a 
行 得 通 ? 


258 Box 
9.35 平面 图 (planar graph) 是 一 个 可 以 画 在 一 个 平面 上 而 其 任何 两 条 边 部 不 相交 的 图 。 
*a, WARE 9.85 中 的 两 个 图 都 不 是 平面 图 、 
b. 证 明 , 在 平 面 负 中 必然 存在 沫 个 项 点 与 最 多 不 超过 五 个 项 总 相连 
^o c. 证 明王 平面 网 中 KISI V:-6- 


on™ 


Ans 
i " 





图 9-85 


9.36 £8 Gnuluügraph) BERANE MS Ba] ap DUE SER (multiple edge MFA AS 
音 中 哪些 算法 对 于 多 重 网 不 用 修改 就 能 证 确 运行 9 对 其 余 的 算法 需要 进行 哪些 修 
p? 
9.37 4G = (V, 上 上 ) 起 一 个 无 向 图 .使 用 深度 优先 搜索 设计 - -个 线 件 算法 , 措 G 的 每 
象 边 续 换 成 有 向 边 使 得 所 得 到 的 图 是 强 连通 的 ,或 者 确定 这 是 不 可 能 的 、 
9.38 给 你 一 把 棍 共 N 根 , 它们 以 某 种 结构 相互 委 斥 平 放 : SR EY a IE s 
每 个 端点 是 由 xX、y 和 和 < 坐标 确定 的 有 厅 一 元 组 AE BEM. 一 根 要 仪 当 
甚 上当 有 要 放置 时 可 以 取 走 .: 
a. 解释 如 何 编 写 一 个 和 便 程 接收 两 根据 a 和 .并 报告 a ERED LR. b FA, 
MES bAK. (本 问 与 图 沦 毫 无 头 系 ) 
b. 给 出 一 个 算法 确定 是 否 能 够 取 走 所 有 的 棍 ， 如 果 能 , 部 么 提供 完成 这 项 工件 的 
HE Sat RAFF o 
9.39 团 问题 (clique problem) 可 以 叙述 如 下 : ATE AIA G = CV, FE) 和 一 个 整数 ， 
如 包含 一 个 最 少 有 并 个 顶点 的 完全 子 图 吗 ? 
顶点 覆盖 问题 {vertex cover problem) uf LRU An P 给 定 IEG = YV, 
天 ) 和 一 个 整数 长 ，G EBLE — T T RV CV 使 得 1V x KOFH G 的 每 东边 
都 有 一 个 项 点 在 Y 中 ? 证 明 团 问题 可 以 多 项 式 地 归 约 成 项 点 覆 广 问题 ， 
9.40 设 哈 密 尔 屯 圈 问题 对 无 问 图 是 NP- 完 全 的 。 
a， 泪 明 啥 密 尔 顿 赔 问 题 对 有 向 图 是 NP- 完 全 的 。 
b. 证 明 简 单 无 权 最 长 路 从 问题 对 有 和 问 图 是 NP- 完 全 的 。 
9,41 棒球 卡 收藏 家 问题 (baseball card collector problem) 如下; EF 片 包 Pi, Pas s 





89 Py DUE — “MRK. 其 中 每 个 包 包 含 年度 棒球 卡 的 一 个 子 集 , 问 是 否 可 能 通过 
32, VERE K 个 包 而 搜集 到 所 有 的 棒球 卡 ? 证明 棒球 站 收藏 家 问题 是 NP- RK. 
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第 10 章 算法 设计 技巧 


迄今 我 们 已 经 涉及 到 一 些 算法 的 有 效 的 实现 。 我 们 看 到 , 当 一 个 等 法 给 定时 ,实际 的 数 
据 结构 无 须 指定 。 为 使 运行 时 间 尽 可 能 地 少 , 需要 由 编程 人 员 来 选择 适当 的 数据 结构 。 

椒 章 我 们 将 把 注意 力 从 算法 的 实 项 转向 算法 的 设计 、 到 现在 为 止 我 们 已 经 看 到 的 大 部 分 
算法 都 是 直接 的 和 简单 的 。 第 9 章 包 含 的 - - 些 算 法 要 深奥 得 多 , 有 些 需要 (在 有 些 情形 下 很 长 
的 ) 论 证 以 证 明 它 们 确实 是 正确 的 。 在 这 - RR. 我 们 将 集中 讨论 用 于 求解 问题 的 币 种 通常 类 
型 的 算法 . 对 于 许多 问题 , 很 可 能 这 些 方法 中 至 少 有 一 种 方法 是 可 以 解决 问题 的 特别 地 ， 
对 于 每 种 类 型 的 算法 我 们 将 

+ 看 到 - 般 的 处 理 方法 。 

区 查 几 个 例子 { 本章 末 尾 的 练习 题 提供 了 更 多 的 例子 )。 

-在 适当 的 地 方 概括 地 讨论 时 间 和 空间 复杂 性 。 


10.1 SRA 


Fe EE ARAA AEA A (greedy algorithm), TESB 9 章 我 们 已 经 看 
4i\— 4. RAR: Dijkstra BRK. Prim RPE A Kruskal A- 贪 焚 算 法 分 阶段 地 工作 - 在 每 一 
个 阶段 , 可 以 认为 所 作 决 定 是 好 的 ， 而 不 考虑 将 来 的 后 果 。 一 般 地 说 , 这 意味 蠢 选择 的 算 
个 局 部 的 最 优 。 这 种 “眼下 能 够 拿 到 的 就 拿 ” 的 策略 即 是 这 类 算法 和 名称 的 来 源 。 妆 算法 终止 
时 ,我 们 希望 局 部 最 优 就 是 全 局 最 优 。 和 如 果 是 这 样 的话 , 那么 算法 就 是 正确 的 ;否则 , 算法 行 
到 的 是 一 个 次 最 优 解 (suboptimal solution) « WRR EGK £808] Ex HESSE, 那么 有 时 用 简单 的 宽 
栖 算 法 生成 近似 答案 , 而 不 是 使 用 一 般 说 来 产生 准确 答案 所 宕 要 的 复杂 算法 . 

有 几 个 现实 的 贪 禁 算法 的 例子 最 明显 的 足 找 零钱 问题 。 Jy p Ham ft NIRA ER. 我 
们 重复 地 配 发 最 大 额 货 币 。 于 荐 ,为 了 找 出 十 七 美元 六 十 -- 美 分 的 零钱 , 我们 拿 出 一 张 PK 
ce, KNEE, AK, 两 个 二 十 五 分 币 , 一 个 十 分 币 ， 以 及 一 个 分 币 , BA 
i. 我 们 保证 使 用 最 少 的 钞票 和 硬币 。 这 个 算法 不 是 对 所 有 的 货币 系统 都 行 得 通 , 但 幸运 的 
i, 我 们 可 以 证 明 它 对 美国 货币 系统 是 正确 的 。 事 实 上 ,即使 允许 使 用 两 美元 钞 和 五 十 美 分 
币 该 算法 仍然 是 可 行 的 。 

交通 问题 有 一 个 例子 , 在 这 个 例子 中 , 进行 局 部 最 优选 择 不 总 是 行 得 通 的 ; 例如 , 在 过 
阿 察 的 某 些 交 通 高 峰 期 间 , 即使 一 些 主要 马路 看 起 来 空 功 功 的 , 你 最 好 还 是 把 车 停 在 这 些 街 
道 以 外 ,内 为 交通 将 会 洪 着 马路 阻 状 一 英里 长 ， (f EL p ER EAS HR ON, AE EUR, 
yf REAR A SERRE, 最 好 是 朝 着 你 的 目的 地 相反 的 方向 临时 绕道 行 魏 。 

本 节 其 余部 分 , 我们 将 考查 几 个 使 用 贪 禁 算 法 的 应 用 。 第 一 个 应 用 中 简单 的 调度 问题 。 
闻 际 |， 所 有 的 调度 问题 或 者 是 NP- 完 全 的 {或 类 似 的 难度 ), 或 者 足 仿 禁 算法 可 解 的 。 第 二 
个 应 用 处 理 文件 压缩 , 它 是 计算 机 科学 最 早 的 成 果 之 一 。 最 后 , 我 们 将 介绍 - :个 贪 禁 近似 算 
法 的 例子 - 
10.1.1 一 个 简单 的 调度 问题 

分 有 作业 dys fas oo dvo. ADO HDG TITTY AY fado s 6S 而 处 理 器 只 有 


们 将 假设 使 用 非 预 占 调度 (nonpreemptive scheduling): 一 旦 开始 一 个 作业 ， 就 必须 把 该 作业 
运行 到 完成 。 

作为 一 个 例子 , 设 我 们 有 四 个 作业 和 相关 的 运行 时 间 ， 恕 图 10-1 所 示 ; 一 个 可 能 的 调度 
在 图 10-2 PAH. RA ;, FH 本 5 个 时 间 单 位 , ja 到 23 完成 , ja 到 26 而 j 到 36 SER, 所 以 
平均 完成 时 间 为 25. 一 个 更 好 的 调度 由 图 10-3 表示 , 它 产 生 的 平均 完成 时 间 为 17.75， 


0 15 23 Jé 36 


图 10-2. | HWSHE 








0 3 E 21 36 
图 10-3 2 号 调度 {最 优 ) 
图 10-3 给 出 的 调度 是 按照 最 短 的 作业 最 先进 行 来 安排 的 。 我 们 可以 让 明 这 将 总 会 产生 
一 个 最 优 的 调度 。 邻 调度 表 中 的 作业 是 元 ai, sie 第 一 个 作业 以 时 间 ER 第 二 个 作 
业 在 t, + 如 后 完成 而 第 三 个 作业 在 n tt, +n SR 出 此 我 们 看 到 ， 沪 调度 总 的 代价 上 
À 


I 
C= NN -R* Dt, (10.1) 
bei 9 x 
C=(N+1) 44 - Qk, (10.2) 
k-i k=] 


注意 , 在 方程 (10.2) 中 第 一 个 求 和 与 作业 的 排序 无 关 , 因此 只 右 第 二 个 求 和 影响 到 总 开 
销 。 设 在 一 个 排序 中 存在 + > y 使 得 上 ro DEBE, HARHA, ZB j, A, BOP, 
从 而 降低 了 总 的 代价 。 因 此 ,所 用 时 间 不 是 单调 非 减 的 任何 的 作业 调度 必然 龙 次 最 优 的 : 亚 
下 的 只 有 那些 其 作业 按照 最 小 运行 时 间 最 先 安排 的 调度 是 所 有 调度 方案 中 最 优 的 : 

这 个 结果 指出 为 什么 操作 系统 调度 程序 一 般 把 优先 权 赋 也 那些 更 短 的 作业 的 原因 。 
多 处 理 器 的 情况 

我 们 可 以 把 这 个 问题 扩展 到 多 个 处 理 器 的 情形 - 我们 还 是 有 作 呈 了 ,j2,… ay, 对 应 的 运 
行 时 间 分 别 为 五 ,二 vt ， 另 外 处 理 器 的 个 数 为 Po 不 失 一 般 人 性 , 我 们 将 假设 作业 是 有 序 
的 , 最 短 的 最 先 运 行 。 作 为 一 个 例子 , 设 P=3. 而 作业 则 如 图 10-4 R. 

图 10-5 显示 一 个 最 优 的 安排 , 它 把 平均 完成 时 间 优 化 到 最 小 : 作业 jy. js 和 六 在 处 再 


器 1 上 运行 ,处理 器 2 人 处理 作业 j2, Js 和 pe. 而 处 理 器 3 运行 其 余 的 作业 总 的 完成 时 间 为 
165, PHE = 18.33. 


9 


RIL TT RIT 265 


ee ees ee se ——-— 





0 3 56 ^43 16 — 20 28 Gà — 40 


图 10-4 作业 和 时 间 图 10-5 多 处 理 器 情形 的 一 个 最 优 解 


解决 多 处 理 器 情形 的 算法 是 按 顺 序 开始 作业 ,处 理 器 之 间 轮 换 分 配 作业 。 个 难 让 明 祝 有 
哪个 其 他 的 顺序 能 够 若 得 更 好 ,虽然 处 理 器 个 数 P 能 够 整除 作业 数 N 时 存在 许多 最 优 的 照 
序 . FRAT OSI N/P, 把 从 jp+1 直 到 jo sop BERE T VEREOR RTI AERE SR D. 我 
们 可以 得 到 这 样 的 最 优 师 序 。 在 我 们 的 例子 中 , 图 10-6 指 出 了 第 二 个 最 优 解 。 





0 3 56 14 [5 20) 30 44 38 
图 10-6 dAbRERETULBUSR EU 


即使 P 不 恰好 整除 NN, 哪怕 所 有 的 作业 时 间 是 车 晃 的 , 也 还 是 有 许多 最 优 解 : 我 们 把 进 
He YS fr BEAR o 
将 最 后 完成 时 间 最 小 化 

在 本 小 节 最 后 , 考 虚 一 个 非常 类 似 的 问题 。 假设 我 们 只 关注 最 后 的 作业 的 结束 时 间 。 在 
上 面 的 两 个 例子 中 , 它们 的 完成 时 间 分 别 是 40 和 38。 图 10-7 指出 最 小 的 最 后 完成 时 间 丰 
34, 而 这 个 结果 显然 不 能 再 改进 了 ， 因为 每 一 个 处 理 器 都 在 一 直 忙 着 。 





0 35 9 1416 19 34 
图 10-7 将 最 后 完成 时 间 最 小 化 
虽然 这 个 调度 没有 最 小 平均 完成 时 间 , 但 是 它 有 个 优点 ， 即 整个 序 区 的 完成 时 间 和 更 于 
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如 果 同 -一 个 用 户 拥有 所 有 这 些 作 业 , 那么 该 调度 是 更 可 取 的 调度 方法 . 虽然 这 些 癌 题 非常 相 
D, 但 是 这 个 新 间 题 实际 上 是 NP- 完 全 的 ; 它 怡 是 背包 癌 是 或 靶 箱 丫 题 的 另 一 种 专 述 方式 ,我 
们 后 面 在 本 节 还 将 遇 到 它 。 因 此 , 将 最 后 完成 时 间 最 小 化 显然 而 比 把 平均 完成 时 间 最 小 化 办 
难得 多 ， 
10.1.2 Huffman 编码 

在 这 一 节 , 我 们 考虑 合 球 算法 的 第 二 个 应 用 , 称 为 交 件 压缩 (file compression) « 

标准 的 ASCII 字符 集 由 大 约 100 个 “可 打印 ”字符 ( 字符 RH me RH 
组 成 。 为 了 把 这 些 字符 区 分 开 来 , 需要 [log 10012 7. | "Qu o 





(00 10 30 
比特 (bn 一 二 进 制 位 )。 但 7 个 比特 可 以 表示 128 个 字 |o 80 Dooo* 
符 , 因此 ASCI 字符 还 可 以 再 加 上 一 些 其 他 的 “ 非 打 印 ” 0091 S | 
字符 。 我 们 加 上 第 8 个 比特 位 作为 奇偶 校 验 位 。 不 过 , 重 | pae mm BB | 


又 的 问题 在 于 , 如 果 字 符 集 的 大 小 是 C, 那么 在 标准 的 
编码 中 就 需要 站 log C 1 个 比特 。 

没 我 们 有 一 个 文件 ， 它 只 包 合 字 符 ae is O 图 10.8 使 用 HEAT 
加 上 一 些 空格 和 newline (换行 )。 进一步 设 该 文件 有 10 
个 a.、15 个 e、12 个 i.3 个 s, 4 个 t.13 个 空 本 以 及 一 个 newtine » 如 图 10-8 rate rz, 这 
个 文件 需要 174 个 比特 来 表示 , WAA 58 个 字符 , 而 每 个 字符 需 鉴 3 个 比特 。 

在 现实 当中 , 文件 可 能 是 相当 大 的 。 许多 非常 大 的 文件 是 菜 个 程序 的 输出 数据 ,而 在 使 
用 频率 最 大 和 最 小 的 字符 之 间 通 常 存在 很 大 的 差别 。 例如, 许多 巨大 的 文件 都 含有 很 多 很 多 
的 数字 、 空格 和 newline, 但 是 4 和 zz HB, 如 果 我 们 在 慢 速 的 电话 线 鞋 传输 这 些 信息 。 孝 
么 我 们 就 会 希望 减少 文件 的 大 小 。 还 有 , 由 于 实际 上 每 一 台 机 器 上 的 伐 盘 空间 都 荐 非常 珍 讽 
的 , 因此 人 们 就 会 想到 是 否 有 可 能 提供 一 种 更 好 的 编码 降低 总 的 所 需 比 特 数 ， 

答案 是 肯定 的 , 一 种 简单 的 策略 可 以 使 一 般 的 大 型 文件 节省 2596 ， 而 使 许多 大 型 的 数据 
文件 节省 多 达 50% ~60% 。 这 种 -- 般 的 策略 就 是 让 代码 的 长 度 从 字符 到 字符 是 变化 个 寺 的 ， 
同时 保证 经 营 出 现 的 字符 其 代码 短 ,。 注意 ,如果 所 有 的 字符 都 以 相同 的 频率 出 现 , 那么 要 市 
省 空间 是 不 可 能 的 。 

代表 字母 的 二 进 制 代 码 可 以 用 二 叉 树 米 表 示 , 如 图 10-9 Bras. 








图 10 9 树 中 原始 代码 的 表示 法 


图 10.9 中 的 树 只 在 类 时 上 有 数据 。 每 个 字符 通过 从 根 节点 开始 用 0 指示 左 分 支 用 1 指 
。。 示 咎 分 支 而 以 记录 路 径 的 方法 表示 出 来 。 例 如 ,s 通 过 从 根 向 左 走 ,然后 向 右 ， KURIER 
PF 过 刘 ,二 是 它 被 编码 成 011。 这 种 数据 结构 有 时 叫做 rie 树 。 如 果 字 符 c, 在 深度 以 处 并 日 出 
352; TF IX, 那么 该 字符 代码 的 值 (cost) 就 等 于 .dijo 

可 以 利用 newline 是 仅 有 的 一 个 儿子 而 得 到 一 种 比 图 10-9 给 出 的 代码 此 好 的 代码 . 通 
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过 把 newline 符号 放 到 它 的 更 高 一 层 的 父 节 点 二 ,我 们 得 到 图 10-10 中 新 的 树 . RRR 
值 症 173, 但 该 值 仍然 远 役 有 达到 最 优 。 





各 10-10. 稍微 好 - - 些 的 树 


注意 , 图 10-19 中 的 树 是 一 棵 满 树 (fal tree): 所 有 的 节点 或 者 是 树叶 . eA AE TILE. 
-- 种 最 优 的 编码 将 总 具有 这 个 性 质 ， 否则 正如 我 们 已 经 看 到 的 ， HA TUDES H auf LA 
[移动 m. 

如 果 字 符 都 只 放 在 树叶 上 , 那么 任何 比特 序列 总 能 够 被 达 无 歧义 地 详 码 。 GLAD. ta E 
是 0100111100010110001000111. 0 不 是 字符 代码 , 01 由 不 足 字 符 代 码 , 但 010 是 1, TER 
-个 字符 是 i。 然 后 跟着 的 是 UL, 它 是 宇 符 s 其 后 的 11 是 newline. 剩 下 的 代 公 分 唱 是 a. 
“she t. i, e A newlines 因此 ， 这 些 字符 代码 的 长 度 是 否 不 同 并 不 要 紧 ， HERE ETE 
是 别 的 字符 代码 的 前 组 即 可 。 这 样 一 种 编码 叫做 前 缓 码 {character code), WR, ME- -TF 
符 放 在 非 树叶 节点 上 ， 那 就 不 再 能 够 保证 译 码 没有 二 义 性 - 

eGR, 我 们 看 到 ,基本 的 问题 在 于 找到 (如 上 上 定义 的 ) 总 价值 最 小 的 满 一 叉 树 ， 其 中 
所 训 的 学 符 部 位 于 树叶 上 . 图 10-11 中 的 树 显 示 该 例 简单 字母 表 的 最 优 树 。 从 图 10-12 可 以 
GH], 这 种 编码 只 用 了 146 个 比特 。 








a DOL 10 30 
* n 15 30 
E , » » A | 
s 00000 3 ji | 
i Un01 4 16 | 
Space 11 13 26 
IN. - | rewhne OOOO 1 5 | 
mio RANAR 图 10-12 RAT 


GE, 存在 许多 最 优 的 编码 。 这 些 编码 可 以 通过 交换 编码 树 中 的 儿子 节点 得 到 ,此 时 ， 
主要 的 未 解决 的 问题 是 如 何 构 造 编 码 树 。1952 E Huffman 给 出 了 一 个 算法 。 因此， 这 种 编码 
AB RAM KS tS (Huffman code). 

哈 夫 受 算 法 

本 小 节 我 们 将 假设 字符 的 个 数 为 CC。 哈 天 曼 算 法 (Huffman s algorithm) RJ ELA GE BH F: 
算法 对 一 个 由 树 组 成 的 森林 进行 。 一 棵 树 的 权 等 二 仑 的 树叶 的 频率 的 和 任意 选 到 最 小 权 的 
PERT, 和 To HERERO T, 和 Ts 为 子 树 的 新 树 ， 将 这 样 的 过 程 进行 C -1 次 。 在 算 
法 的 开始 , 存在 C 标 音节 点 树 一 一 每 个 字符 一 森 。 在 算法 结束 时 得 到 一 棵 树 , 这样 树 就 是 二 
(LR K EAH. 
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我 们 通过 一 个 具体 例子 来 搞 清 算法 的 操作 . 图 10-13 表示 的 是 初始 的 森林 ;每 保 树 的 权 
在 根 处 以 小 号 数 笠 标 出 。 将 两 覃 权 最 低 的 树 合并 到 一 起 , 由 此 建立 了 图 10- 14 中 的 麻 林 . 我 
们 将 新 的 根 命名 为 本 | ,这样 可 以 确切 无 误 地 表述 进一步 的 合并 。 图 中 我 们 令 s 是 左 儿 子 , 这 
E, 令 其 为 左 儿 子 还 是 右 儿 子 是 任意 的 :注意 可 以 使 用 哈 夫 坚 算 落 描 述 中 两 个 任意 性 。 新 树 
的 总 的 权 正 是 那些 老 树 的 权 的 和 ， 当 然 也 就 很 容易 计算 . 由 于 建立 新 畦 只 击 得 出 TET 
Ho, 建立 左 指 针 和 和 右 指针 并 把 权 记 录 下 来 、 因 此 创建 新 树 很 简单 。 


o © OO OO © @ 


图 10-13 RARER 


mai 
图 10-14 ARAIA EAS RE 


HEARRE. ef BURR BD. ORE TI 和 +， 然后 将 它们 合并 成 一 
HR. 树 根 在 T2, REBR, ME 10- 15。 BPE T2 Hla 合并 建立 T3, 其 权 为 10+ 8= 18， 
图 10-16 显示 这 次 操作 的 结果 。 
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410-15 第 一次 台 放 后 的 了 哈 去 曼 算法 

By o 
ALS 
P 
ar D 
e) FY GG © £m 


图 10-16. -KAHENE AA 


让 第 二 次 合并 完成 后 . BARR RR i SRR ARCU ou s 图 10- 17 指出 
这 两 棵 树 如 何 合并 成 根 在 TA 的 新 树 。 第 五 步 合并 根 为 和 了 3 的 树 ， 因为 这 两 棵 树 的 权 最 
Jy. 该 步 结果 如 图 10-18 所 示 。 
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图 10-17. SEEK etus S RE 
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图 10-18 第 五 次 合并 后 的 哈 大 曼 算 法 


最 后 , 将 两 个 剩 下 的 树 合 并 得 到 图 10-11 所 示 的 最 优 树 . 图 10-19 BRB A, 其 
RTE T6. 





图 10.10. 最 后 一 次 合并 后 的 哈 夫 曼 算 法 


我 们 将 概述 哈 夫 学 算法 产生 最 优 代 码 的 证 明 思 路 ;详细 的 细节 将 留 作 练习 . HE. A 
让 法 不 难 证 明 树 必然 是 满 的 ,因为 我 们 已 经 看 到 一 棵 不 满 的 树 是 如 何 改进 成 满 估 的。 

其 次 , 我 们 必须 证 明 两 个 频率 最 小 的 子 符 a Aa p AEP TRUS Tk CER RACAL BC uj 
LA [p] FÉ TO, BOREL RIBERA TER, BAIR oR ARERR A, 那么 必然 存在 
ET y 居 最 洪 的 节点 { 记 住 树 是 满 的 )。 SOR a 的 频率 小 于 Y. 那么 我 们 可 以 通过 交换 它们 在 
树 中 的 位 置 而 改进 权 的 值 。 

然后 我 们 可 以 论证 , 在 相同 深度 上 任意 两 个 节点 处 的 字符 可 以 交换 而 不 影响 最 优 性 : 这 
说明, 总 可 以 找到 一 棵 最 优 香 , 它 含 有 两 个 最 不 经 常 出 现 的 符号 作为 兄弟 ;因此 第 一 步 没有 
H. MOL. 

证 明 可 以 通过 归纳 法 论证 完成 。 当 树 被 合并 时 ,我 们 认为 新 的 字符 集 是 在 根 上 的 郝 些 字 
A 于 是 , 在 我 们 的 例子 中 , 经 过 四 次 合并 以 后 , 我 们 可 以 把 字符 集 看 成 出 e 与 元 字符 了 3 和 
T4 组 成 . 这 屎 怕 是 证 明 最 微妙 的 部 分 ;我 们 要 求 读者 补足 所 有 的 细 姜 - 

该 算法 是 贪 禁 算法 的 原因 在 于 , 在 每 一 阶段 我 们 都 进行 一 次 合并 而 没有 进行 全 局 的 考 
IE, 我们 只 是 选择 两 棵 最 小 的 树 。 

妇 果 我 们 依 权 排序 将 这 些 符 保 存在 一 个 优先 队列 中 , IBA, 由 于 对 元 素 个 数 不 超 过 局 的 
做 先 队 列 和 将 进行 -一 次 BuildHeap, 2C - 2 1X. DeleteMin $i C - 2 次 Insert, 因此 运行 时 间 为 
OC logC)。 使 用 一 个 链表 简单 实现 该 队列 将 给 出 一 个 OLC*) 算 法 。 优先 队列 实现 方法 的 园 
RAF C 有 多 大 TE ASCH 字符 集 的 典型 情况 下 ，C 是 足够 小 的 , 这 使 得 二 次 的 运行 时 间 
是 是 以 接受 的 。 在 这 样 的 应 用 中 ,实际 上 几乎 所 有 的 运行 时 间 都 将 花费 在 读 人 输入 文件 和 瑟 
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ili Eee Se Ar ri RA I/O E. 

有 了 两 个 细节 必须 要 考虑 。 首 先 , CE SE FR AE eK ST, AOA T 
可 能 译 码 . OXER JURE I, 052 2J 10.4。 对 于 一 些小 文件 , 传送 编码 信息 表 的 代价 将 
超过 庄 缩 带 来 的 任何 可 能 的 节省 , 最 后 的 结果 很 可 能 是 文件 扩大 。 当然 , 这 可 以 检测 到 卫 原 
文件 可 原样 保留 。 对 于 大 型 文件 , 信息 表 的 大 小 是 无 其 紧要 的 。 

第 二 个 问题 是 ; 该 算法 是 一 个 两 越 扫描 算法 , 第 一 侦 搜 集 频 兴 数 据 , 第 一 侦 进行 编码 。 
TA, 对 于 处 理 天 现 文 件 的 程序 来 说 这 个 性 质 林 是 我 们 所 希望 的 。 某 坚 另 外 的 做 法 在 参考 文 
献 中 做 了 介绍 . 


10.1.3 近 羽 装 箱 问题 


在 这 一 节 , 我 们 将 考虑 某 些 装 箱 问 题 (bin packing problem) 的 算法 . 这 些 算法 将 运行 得 很 
th, 但 未 必 产 生 最 优 解 。 不过, 我 们 将 证 明 所 产生 的 解 卫 最 优 解 不 太 远 。 

设 给 定 N 项 物品 , 大 小 为 51，s2，…， sw， 所 有 的 大 小 者 
WE O«ssl. 问题 是 要 把 这 些 物品 装 到 最 小 数 自 的 箱子 中 
二 ,已 知 每 个 箱子 的 容量 是 1 个 单位 ; 作为 例子 , 图 10-20 
Bad 0.2, 0.5, 0.4, 0.7, 0.1, 0.3, 0.8 的 一 批 物 
ib LE FA BY A E: 

有 黄种 版 本 的 装 箱 问题 。 第 一 种 是 联机 (on-line) 装 第 问 
题 。 在 这 种 问题 中 , 必须 将 每 一 件 物 品 放 人 一 个 箱子 之 石 才 
处 理 人 下 一 件 物 品 。 第 二 种 是 脱 机 toff-line) 装 箱 问 题 。 在 一 个 
脱 机 装 箱 算法 中 , 我 们 做 任何 事 都 需要 等 到 所 有 的 输入 数据 
全 被 读 和 信之 后 才 进 行 . 联机 算法 和 脱 机 算法 之 间 的 区 别 在 8.2 节 讨 论 过 。 





图 10-20 340.2. 0.5, 0.4, 
0.7, 0.1, 0.3. 0.8 的 最 优 装 逢 


联机 算法 


要 考虑 的 第 个 问题 足 ， 一 个 联机 算法 即使 在 允许 无 限 计算 的 情况 下 是 省 实际 上 总 能 给 
路 设 优 的 解答 。 我 们 知道 ， 即 使 允许 无 限 计算 ,联机 算法 也 必须 先 放 人 一 项 物品 然后 才能 处 
现下 一 件 物品 并 且 不 能 改变 决定 。 

为 了 证 明 联 机 算法 不 总 能 够 给 出 最 优 解 ,我 们 将 给 它 一 组 特别 难 的 数据 来 处 理 。 考 虑 山 
重量 为 二 - c 的 M 个 小 项 和 其 后 重量 为 方 + e 的 M 个 大 项 构成 的 序列 1, 其 中 0<s<0.0 


TER, 如 果 我 们 在 每 个 箱子 中 放 一 个 小 项 再 放 一 个 大 项 ， 3E A xc te gi o aL BT VARA M 个 
箱子 中 去 。 假 设 存在 一 个 最 优 联机 算法 A 可 以 进行 这 项 装 箱 工 作 。 考 虑 算法 A MPS D. 的 
操作 ， 该 序列 只 由 重量 为 了 -e IM T/T. 12 是 可 以 装 人 [MI 个 箱子 中 的 -。 然而 ， 
由 于 A 对 序列 上 的 处 理 结果 必然 和 对 五 的 前 半 部 分 处 理 结果 相同 , 而 P, 前 半 部 分 的 输 人 
跟 5 的 输入 完全 相同 , 因此 A 将 把 每 一 项 物品 放 到 一 个 单独 的 箱子 内 。 这 说 明 A 将 使 用 的 
箱子 的 个 数 是 使 用 L icf By Ps f 这 样 我 们 证 明了 ,对 于 联机 装 箱 癌 题 不 存在 最 优 径 法 ， 

上 面 的 论述 指出 , 联机 算法 从 不 知道 输入 何 时 会 结束 , 因此 它 提供 的 任何 性 能 保证 必 珊 
在 整 个 算法 的 每 一 时 刻 成 立 。 3j 3 4 | AAT CREE ERE , 那么 我 们 可 以 证 明 下 列 定 理 。 


E 10.1 


存在 使 得 任意 联机 装 箱 算法 至 少 使 用 3 最 优 箱子 数 的 输入 。 

EAR : 

假设 情况 相反 ,为 简单 起 见 设 M 是 偶数 。 考 虑 任 一 运行 在 上 面 输入 序列 h 上 的 联机 算 
A. 注意 , 该 序列 由 M 个 小 项 后 接 M 个 大 项 组 成 。 让 我 们 考虑 该 算法 在 处 理 第 M 项 
后 部 做 了 什么 . BA 已 经 用 了 6 个 箱子 . ERA, 箱子 的 最 优 个 数 是 M /2 ,因为 我 们 可 


以 在 每 个 箱子 里 放 人 两 件 物品 。 于 是 我 们 知道 、 根 据 我 们 的 低 于 人 的 性 能 保证 的 假设 ， 


2b M<, 


现在 考虑 在 所 有 的 物品 都 被 装 箱 后 算法 A 的 性 能 。 在 第 5 PAP ITP RRO AB FP 
每 箱 恰好 包含 一 项 物品 , 因为 所 有 小 物品 都 被 放 在 了 前 个 箱子 中 ,而 两 个 大 项 物品 又 次 不 
进 -个 箱子 中 去 。 由 于 前 5 个 第 子 每 箱 最 多 能 有 两 项 物品 , 而 其 余 的 箱子 每 箱 部 有 一 项 物 
品 , 内 此 我 们 看 到 , 将 2M 项 物品 装 箱 将 至 少 需 要 2M ~ b 个 箱子 。 但 2M 项 物品 可 以 用 M 


个 箱子 最 优 装 箱 ， 因 此 我 们 的 性 能 保障 保证 得 到 (2M - 6) /M< 5. 
第 一 个 不 等 式 意味 着 6/M< 分， 而 第 二 个 不 等 式 意味 着 64M> 生 ,这 是 矛盾 的 . 因此. 


3 

没有 联机 算法 能 够 保证 使 用 小 于 3 的 最 优 装 箱 数 完成 装 箱 。 

有 三 种 简单 算法 保证 所 用 的 箱子 数 不 多 于 二 售 的 最 优 装 箱 数 , 也 有 颇 多 更 为 复杂 的 算法 
能 够 得 到 更 好 的 结果 。 
下 项 适合 算法 

大福 最 简单 的 算法 就 属 下 项 适合 (next fi 算法 了 。 当 处 理 任何 一 项 物品 时 ,我 们 检查 看 
它 足 否 还 能 装 进 刚刚 装 进 物品 的 辣 -- 个 箱子 中 去 。 如 果 能 够 装 进去 , 那么 就 把 它 放 人 该 箱 
中 ;否则 ,就 开辟 一 个 新 的 箱子 。 这 个 算法 实现 起 来 出 奇 地 简单 ,而 且 还 以 线性 时 间 运 行 图 
10-21 显示 对 于 与 图 10-20 相 网 的 输入 所 得 到 的 效 箱 过 称 。 





图 10-2] 对 0.2, 0.5, 0.4, 0.7, 0.1, 0.3. 0.8 的 下 项 送 合算 法 


下 项 适合 算法 不 仅 编程 简单 ,而 用 它 的 最 坏 情形 的 行为 也 容易 分 析 。 

定理 10.2 

Ay M 是 将 一 列 物品 工装 箱 所 需 的 最 优 装 箱 数 , 则 下 项 适合 算法 所 用 箱 数 绝 不 超过 2M 
个 箱子 。 存在 一 些 顺 序 使 得 下 项 适合 算法 用 箱 2M -2 个 。 


证 明 : 


考虑 作 何 相 邻 的 两 个 箱子 B, MB, 1- B, MB,. 


E I0 x 


EAT a th ACN SMIRK F L, 


出 所 有 这 些 多 时 就 全 全 部 放 人 Bh DRR IREYA TNT OE MAMARE i 
么 我 们 看 到 , 顶 多 有 一 半 的 空间 闲置 , 因此 , 下 项 适合 算法 最 多 使 用 二 们 的 最 优 箱子 数 ，; 

为 说 明 这 个 界 是 精确 的 , 设 N 项 物品 , 0H : 是 奇数 时 ,物品 的 太 小 s =0.5 而 当 ;是 
偶数 时 s =2AN, WEN 可 被 4 整除 , 图 10-22 所 杰 的 最 优 装 箱 由 含有 2 件 大 小 为 0.5 的 
物品 的 N74 个 箱子 和 含有 ON 72 件 天 小 为 27N 物 邮 的 一 个 头子 组 成 ,总数 为 (N/A4) 4 1。 
图 10-23 表 示 下 项 适合 算法 使 用 NST. 因此 ,下 项 适合 算法 可 以 用 到 几乎 本 售 -+ 
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Be UL Fa HFS Fo 
图 10-22 对 0.5, Z/N, 0.5. 24N, 0.5, 27N enn 的 最 优 装 箱 方法 
图 10-23 对 0.5, 27N, 0.5, 27N, 0.5, 27N, we AY PUA SRB 
首次 idein 


虽然 下 项 适合 算法 有 一 个 合理 的 性 能 保证 , 但 是 


, 它 的 效果 在 实践 中 却 很 其 ,内 为 在 不 


a E APR CROHE THAT. EMIRIB I. 本 可 以 把 大 小 .3 的 物品 


BA B, 或 By 而 不 是 开 尽 一 个 新 箱子 。 
首次 适合 算法 (first fit) 的 策略 是 恢 序 扫 括 这 文 此 
箱子 但 把 新 的 一 项 物品 放 入 足 能 盛 下 它 的 第 一 个 
箱子 中 . 因此 , 只 有 当先 前 放置 物品 的 结果 已 经 没 
有 再 窜 下 当前 物品 余地 的 时 候 , RITAR -iA 
EE. FE 10-24 指出 对 我 们 的 标准 输入 进行 首次 适 
合算 法 的 装 箱 结果 。 
实现 首次 适合 算法 的 一 个 简单 方法 是 通过 亚 
Hd d m TP WEE, BHR 
OND 有 可 能 以 O(N log NEITA AG 





Fi 10-24 80.2, 0.5, 0.4. 0.7. 0.1. 
0.3, 0.8 的 首次 适合 装 箱 法 


全 算法 ;我 们 把 它 留 作 练习 。 

略 加 思索 读者 即 可 明白 ， 在任 一 时 刻 最 多 有 一 个 箱子 其 空 出 的 部 分 大 于 箱子 的 一 半 ， 内 
为 戎 有 第 二 个 这 样 的 箱子 , 则 它 装 的 物品 就 会 装 到 第 一 个 这 样 的 箱子 中 了 - 因此 我 们 可 以 立 
即 断 言 : 首次 适合 算法 保证 其 解 最 多 包含 最 优 装 箱 数 的 二 倍 。 

另 一 方面 , 我 们 在 证 明 下 项 适合 算法 性 能 的 界 时 所 用 到 的 最 坏 情况 对 首次 适合 算法 不 适 
i. 因此 ,人 们 可 能 要 问 : 是 否 能 够 证 明 更 好 的 界 呢 ? 答案 是 肯定 的 ,不 过 证 明 要 复杂 一 些 。 

定理 10.3 

令 M 是 将 一 列 物品 装 箱 所 需要 的 最 优 箱子 数 , 则 首次 适合 算法 使 用 的 箱子 数 绝 不 多 

T| UM |. 存在 使 得 首次 适合 算法 使 用 局 (M - 1) 个 箱子 的 顺序 - 

WEBB: 

参阅 本 章 末 尾 的 参考 文献 

使 用 首次 适合 算法 得 出 的 结果 和 前 面 定理 指出 的 结果 几乎 一 样 差 的 例子 见 图 10-25 所 
示 。 图 中 的 输入 由 6M 个 大 小 为 十 e 的 项 后 跟 6M PADI +e BOSAL AE TOR OM 个 


大 小 为 十 + e 的 项 组 成 ，- -种 简单 的 装 箱 办 法 是 将 每 种 大 小 的 各 一 项 物品 装 到 一 个 箱子 中 
总 共 需 要 OM MAT. 如 用 首次 适合 算法 ， 则 需要 10M 个 箱子 。 





万 | By Bag OB aay B gate) >E oy 
图 10-25 首次 适合 算法 使 用 10M 个 而 不 是 SM 个 箱子 的 情形 


当 首次 适合 算法 对 大 量 其 大 小 均匀 分 布 在 0 和 1 之 间 的 物 总 进行 运算 时 , 经 验 络 乐 析出 ， [360 
首次 适合 算法 用 到 大 约 比 最 优 装 箱 方 法 多 2% 的 箱子 。 在 许多 情况 下 , 这 是 完全 可 以 接受 的 ， Pa 
最 佳 适合 算法 A 
我 们 将 要 考查 的 第 二 种 联机 策略 是 最 住 适合 算法 (best fit). BER EET WA 
所 发 现 的 第 一 个 能 够 容纳 它 的 箱子 , 而 是 放 到 所 有 箱子 中 能 够 容纳 它 的 最 满 的 箱子 中 。 典 型 
B5 3 4627 2: n E] 10-26 Pras. 
注意 , 大 小 为 0.3 BEL ERE Bz MERET 








By, 此 时 它 正好 把 Bs 填 满 。 PREM | o | u 
和 更 细致 的 选择 , 因此 入 们 可 能 认为 算法 性 能 保障 会 | dp 
有 所 改善 。 但 是 情况 并 非 如 此 ， 因 为 总 的 说 来 坏 情形 是 | o2 | | 


相同 的 ， 最 佳 适合 算法 比 起 最 优 算 法 , 绝 不 会 坏 过 1.7 ^ B; B, E, 
信和 左右 , MEFE SA, 对 于 这 些 输入 该 算法 ( 几 图 10-26 0.2, 0.5. 0.4, 0.7, 0.1. 
乎 ;达到 这 个 界限 。 不 过 , 最 佳 适合 算法 编程 还 是 简单 0.3, 0.8 的 最 佳 适 合算 法 


Ae 8 10% 








的 , 特别 是 当 需 要 ON log N) 算 法 的 时 候 , 而 有 该 算法 对 随机 的 输入 确实 表现 得 更 好 
脱 机 算法 

如 果 我 们 能 够 观察 全 部 物品 以 后 再 算出 答案 , 那么 我 们 应 该 会 做 得 更 好 。 事 实 确实 如 
Wb. 由 于 我 们 通过 彻底 的 搜索 能 够 最 终 找到 最 优 装 箱 方法 , 因此 我 们 对 联机 情形 就 已 经 有 了 
一 个 理论 上 的 改进 。 

所 有 联机 算法 的 主要 问题 在 于 将 大 项 物品 装 箱 困难 ， PEN 
特别 是 当 它们 在 输入 的 晚期 出 现 的 时 候 ， 围 绕 这 个 问题 的 [i | S 
自然 方法 是 将 各 项 物品 排序 , 把 最 大 的 物品 放 在 最 先 。 此 | 
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时 我 们 可 以 应 用 首次 适合 算法 或 最 佳 适合 算法 , 分别 得 到 
首次 适合 遂 减 算法 {first fit decreasing) Hl 4E i£ &- ub i, Rx 
{best fir decreasing). 图 10-27 指出 在 我 们 的 例子 中 这 会 产 B, R. 
生 最 优 解 (尽管 看 一般 的 情形 下 显然 未 必 会 如 此 )。 | 

本 小 节 我 们 将 处 理 首 次 适合 递减 算法 。 对 于 最 佳 适 合 图 10-27 对 0.8, 0.7, 0.5, 0t 
遂 减 算法 ， 结 果 几 乎 是 .- 样 的 。 由 于 存在 物 唱 大 小 不 耳 异 03 02. OT ADEE SSH 
的 可 能 .因此 有 些 作 者 更 愿意 把 首次 适合 递减 算法 叫做 商 次 适 含 非 增 算 法 (first fit nonin- 
creasing). 我 们 将 沿用 原始 的 名 称 。 不 失 一 般 性 , 我 们 还 要 假设 输入 数据 已 经 根据 大 小 排序 。 

我 们 能 够 做 的 第 一 个 评注 是 , 首次 适合 算法 便 用 10M 个 而 不 是 6M 个 箱子 的 坏 情 形 在 

品 项 被 排序 的 情况 下 不 会 再 发 生 。 我 们 将 证 明 , 如 果 一 种 最 优 装 箱 法 使 用 M 个 箱子 , 那么 
首次 适合 递减 算法 使 用 的 箱子 数 绝 不 想 过 (4M +1) /3。 

这 个 结果 依赖 于 两 项 观察 。 首先, 所 有 重量 大 于 -3 的 项 将 被 放 入 前 M 个 箱子 内 。 这 意味 
B. 在 外 加 的 箱子 中 所 有 各 项 的 重量 顶 多 是 a。 第 二 个 结论 是， 在 外 加 的 箱子 中 物品 的 项 数 
总 多 可 以 是 M - 3. 把 这 两 个 结果 结合 起 来 我 们 发 现 , 外 如 的 箱子 最 多 可 能 需要 [(M - D 3 
个。 现在 我 们 证 明 这 两 项 观察 结果 。 

引 理 10.1 

4 N 项 物品 的 输入 大 小 (以 递减 顺序 排序 ) 分 别 为 s1，s2，“…，sw， 并 设 最 优 装 箱 方 法 使 


用 M 个 箱子 。 那么 首次 适合 递 碱 算法 放 到 外 加 的 箱子 中 的 所 有 物品 的 大 小 最 多 为 
HERA : 
BS i 项 物品 是 放 人 第 M 1 1 个 箱子 中 的 第 一 个 物品 。 我 们 需要 证 明 9 Sy s RINE 





反 证 法 证 明 这 个 结论 。 设 s> 了。 


和 


f I, 所 有 的 箱子 By; B5, Ug. By 每 个 最 多 只 LE P4395 n o 
ZETE :— p 项 物品 被 放 和 一 一 个 箱子 后 但 第 i 项 物品 尚未 放 入 时 系统 的 状态 . Be 


在 我 们 想 要 证 明 ( 在 s; Di 的 假设 下 ) 前 M 个 箱子 排列 如 下 : 首先 是 厂 些 箱子 内 恰好 有 


一 项 物 铝 然后 油 下 的 箱子 内 有 两 项 物品 。 
没有 两 个 箱子 B. ALB, 使 得 1<r< ym M, B, 有 两 山 而 卫 ， 有 一 项 ; 令 "A 和 rj 
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一 一- 一 一 一 一 -一 一 一 








OC 一 CC 一 


B, PRRI m, ES y 是 B, PRIRA mo riyo 因为 xl 被 放 在 较 前 的 箱子 中 。 H 
据 类 似 的 推理 sse BE, zt zs: + sis 这 意味 着 s, 是 应 该 可 以 放 在 B, 中 的 。 根 据 我 


们 的 假设 ,这 是 不 可 能 的 因此 ,如 未 s; >, 那么 在 我 们 试图 处 理 s 时 ,这 样 安排 前 M 个 


箱子 ,使 得 前 7 个 箱子 和 名 装 一 个 物品 , 而 后 M- i ARTERA an. 

为 了 证 明 该 引 理 , 我 们 将 证 明 不 存在 将 所 有 物品 装 人 M 个 箱子 的 方法 , 这 和 引 理 的 假 
GUY. 

显然 , susp cns s 中 使 用 任何 算法 部 没有 两 项 可 以 放 人 一 个 箱子 中 ， BA AUR RE 
放 . 那么 首次 适合 算法 也 能 放 。 我 们 还 知道 , 首次 适合 算法 尚 林 把 大 小 为 Sis 5025 S, 
中 的 任 一 项 放 和 人 前 7 个 箱子 中 , 因此 它们 都 不 适合 。 这样 . ERTER, 特别 是 最 优 表 
箱 方法 中 , 必然 存在 ) 个 箱子 不 包含 这 些 项 。 由 此 可 知 , CADO seis sace cr. s BEDS 
然 包含 在 M-j 个 箱子 的 集合 中 , 考虑 到 前 面 的 讨论 , 于 是 这 些 项 的 总 数 为 20M — 0. 


注意 , WOR ss, >$, 那么 只 要 证 明 s 没有 方法 放 人 这 M 个 箱子 当中 的 一 个 中 去 , AIN 


的 证 明 也 就 完成 了 。 事实 上 , 显然 它 不 能 放 入 这 j 个 箱子 中 去 , 因为 假如 能 放 人 , IARR - 


适合 算法 也 能 够 这 么 做 , 把 它 放 入 其 余 的 M -i 个 箱子 之 一 中 震 要 把 2CM - 7) +1 项 物品 分 
发 到 这 M i 个 箱子 中 。 因 此, 某 个 箱子 就 不 得 不 装 人 三 件 物 操 ， 而 它们 中 的 每 一 件 部 大 于 


l, gi, 这 是 不 可 能 的 。 
这 与 所 有 大 小 的 物品 都 能 够 装 人 M 个 箱子 的 事实 矛盾 ,因此 开始 的 假设 肯定 是 不 正确 
的 ， 从 而 s; 


引 理 10.2 

放 入 外 加 的 箱子 中 的 物品 的 个 数 最 多 是 M 一 1。 

证 明 : 

假设 放 入 外 加 的 箱子 中 的 物品 至 少 有 M 个 。 我 们 知道 > is M ,因为 所 有 的 物品 
都 可 装 人 M 个 箱子 。 设 对 于 UM, 箱子 B, AUG FOR W)。 设 前 M 个 外 加 箱子 中 
的 物品 大 小 为 1，x2，…， am 此 时 ,由 于 前 M 个 箱子 中 的 项 加 上 前 M 个 外 加 箱子 中 
的 项 是 所 有 物品 的 一 个 子 集 ， TE 


YN. NW, 十 > T, = - Moy toan) 
现在 W, +2, >l, 8 BINAE s. IURE ARA B H, 因此 
5; > Dism 


即 这 N 项 被 装 人 M ETEEN. 因此 . 最 和 多 只 能 有 M- ETAHI RIH Ain o 
定理 10.4 

^- M 是 将 物品 集 T 装 箱 所 需 的 最 优 箱子 数 ， 则 首次 适合 递减 算法 所 用 第 子 数 绝 不 超过 
(4M + 19/3. 


> PRECARA LERA M- 个 箱子 并 在 每 个 第 子 中 族人 病 项 物品 ,内 此 有 2 浆果 一 7) 再 。 


1 
— 


(24 | 


证 明 : 

存在 M 一 1 项 外 加 的 箱子 中 的 物品 , 其 大 小 至多 为 也 HUC, 最 多 可 能 存在 [(M -1)/3] 个 

其 余 的 第 子 . M. 由 首次 适合 递减 算法 使 用 的 箱子 总 数 最 多 为 [ (4M — DAUM * 0/73, 
HEREDES, 对 于 首次 适合 递减 算法 和 下 项 适合 递减 算法 , BARK HEB E BUR 

定理 10.5 

令 M 是 将 物品 集 了 装 箱 所 需 的 最 优 箱子 数 , 则 首次 适合 递减 算法 所 用 箱子 数 绝 不 超过 

E M+ 4。 此外, 存在 使 得 首次 适合 递减 算法 用 到 LNM 个 箱子 的 序列 ， 

UE RR ; 

LR EER. 下 界 可 以 通过 下 述 序列 展示 : Je A) +e 的 6M TR. 

其 后 是 大 小 为 二 +2s 的 6M IR, f 下 来 是 二 +e 的 6M 项 ,最 后 是 大 小 为 1 - 2e 的 


[2M 项 物品 。 图 10-28 指出 最 优 装 箱 需 要 9M 个 箱子 , 而 首次 适合 递减 算法 需要 IM 
个 箱子 。 


Bi a 





BB Boma Bo Bu Boy Beuna >E amt iea OF i 
图 10-28 首次 道人 台 递 减 算 法 合用 11M 个 箱子 , 但 只 有 9M 158 TREI T RUBER B T 


在 实践 中 , 首次 适合 递减 算法 的 效果 非常 好 。 如 果 大 小 在 单位 区 间 均 悦 分 布 ， 那么 外 有 加 
的 箱子 的 期 望 个 数 为 日 (v M )。 装 箱 算法 是 简单 宽 丈 试探 算法 能 够 给 出 好 结果 的 -~ 个 好 
例子 。 


10.2 分 治 算法 


用 于 设计 算法 的 另 一 种 常用 技巧 为 分 治 {divide and conquer) FLIX - 分 治 算法 出 两 部 分 组 成 ; 

分 (divide); 递归 解决 较 小 的 问题 (当然 ,基本 情况 除外 )。 

34 (conquer): 然后 ， 从 子 问 题 的 解构 建 怕 问题 的 解 : 

传统 E, 在 让 文中 至 少 含有 商 个 递归 调用 的 例 程 岂 做 分 治 算法 , 而 正文 中 只 含 一 个 递归 
调用 的 例 程 不 是 分 治 算法 , 我 们 一 般 坚 持 子 问题 是 不 相交 的 { 即 基本 上 不 重 看)。 让 我 们 回顾 
森 书 涉及 到 的 其 些 递归 算法 。 

我 们 已 经 看 到 几 个 分 治 算法 。 在 2.4.3 节 我 们 见 过 最 太子 序列 和 问题 的 一 个 
OCN log N) 解 。 在 第 4 章 , 我 们 看 到 过 - - 些 线性 时 间 的 树 遍历 方法 。 在 第 7 RE, 我 们 见 过 分 
治 算法 的 经 典 例 子 ， 即 归并 排序 和 快速 排序 , 它们 在 最 坏 情 形 以 及 平均 情形 分 别 有 
OLN log. NOBEL) o 
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我 们 还 看 到 过 递归 算法 的 苦 十 例子 , 在 分 类 上 它们 很 可 能 不 算 作 分 治 算法 , 而 只 是 化 简 
$i— ^ d (8 PG eL. TE 1.3 节 , 我 们 看 到 - -个 简单 的 显示 一 个 数 的 例 程 : 在 第 2 章 , 我 们 使 
用 递归 执行 有 效 的 取 寡 运算 。 在 第 4 章 , 我 们 考察 了 二 又 查找 树 一 些 简 单 的 搜索 例 程 。 在 6.6 
节 , 我 们 见 过 用 于 合并 左 式 堆 的 简单 的 递归 在 7.7 节 给 出 了 一 个 花费 线性 平均 时 间 解 决 选 
择 问 题 的 算法 . 第 8 章 递 妇 地 写 出 了 不 由 交集 的 Find BRE. 第 9 RAA Dijkstra 等 法 更 新 
找 于 最 短路 径 的 一 些 例 程 以 及 对 图 进行 深度 优先 搜索 的 其 他 过 程 。 这 些 算法 实际 上 都 不 是 分 
党 算法 ,内 为 只 进行 了 一 次 递归 调用 : 
我 们 在 2.4 WHR SPITE BE A AA AE, FRA SE eA BRIE 
但 它 的 效率 太 莽 了 , 因为 问题 实际 上 根本 没有 被 分 割 
在 这 一 节 , 我 们 将 看 划分 治 算法 更 多 的 范例 . 我 们 的 筝 一 个 应 用 是 计算 几何 中 的 问题 : 
给 定 平面 上 的 N 个 点 , 我 们 将 证 明 最 近 的 一 对 点 可 以 在 O(N log N) 时 间 找 到 。 本草 后 面 的 
一 些 练习 描述 了 计算 几何 中 男 外 一 些 问题 , 它们 可 以 由 分 治 算 法 求解 。 本 节 其 余部 分 证 明理 
论 上 一 些 极 其 有 趣 的 结果 - 我 们 提供 一 个 算法 以 O(N ) 最 坏 情形 时 间 解 决 选 择 问 题 , 我们 还 
要 证 明 可 以 用 ofCN2) 操 作 将 2 个 N- 比特 位 的 数 相 莱 并 以 o( CN RAER A TERE., DE 
的 是 ,虽然 这 些 算法 最 坏 情形 时 间 界 比 传统 算法 更 好 , 但 如 果 输 入 并 不 特别 巨大 , 则 扬 们 都 
并 不 实用 . 
10.2.1 分 治 算法 的 运行 时 间 
我 们 将 要 看 到 的 所 有 有 效 的 分 治 算法 部 是 把 问题 分 成 一 些 子 问题 , 每 个 子 问题 都 是 原 问 
题 的 -部 分 , 然后 进行 其 些 附 加 的 工作 以 算出 最 后 的 答案 。 作 为 一 个 例子 , 我 们 上书 经 春 到 归 
并 排序 对 两 个 问题 进行 运算 ,每 个 问题 均 为 原 问题 大 小 的 一 半 ， 然 后 使 用 OCN Sita UTE. 
由 此 得 到 运行 时 间 方 程 ( 带 有 适当 的 初始 条 件 ) 
TON) =2T(N2)+ OCN) 
3e es 7 章 看 到 ,该 方程 的 解法 为 O(N log N) 下 面 的 定理 可 以 用 来 确定 大 部 分 分 
治 算法 的 运行 时 间 。 
定理 10.6 
WHE TON) =aT(N/b) + GCN'ORURROS 
(O(N ) rab 
T(N) 240CNflogN) Fazi 
LOCN*) Bac 
Ral a321, b> i. 
TE AR : 
根据 第 7 章 归并 排序 的 分 析 , 我 们 将 假设 N o BELT. 可 令 N= 8". 此 时 NA = 
ore NE = (ome ante vo s (G ORBE TO) = 1, 并 忽略 BCN PAIR 
HAF., WA 
Te") = aT (a!) + (F)" 
WERA a BRAA., MEE 
rib") _ Tie") a (10.3) 
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T (pty B T (p) p m-1 

qud T gea Cla (10.4) 

Tib™-2) Try wey 

abo 00393 Cla (10.3) 
Tibl}  T(b9) pl | 
gi 一 a0 + a (10.6) 


RIAKO. DAL ORAA P P2143 91 GRE B RE EIS, 等 号 左边 的 所 有 项 实 
际 上 与 等 号 右边 的 前 一 项 相 消 ， 由 此 得 到 





| ao 
- S| 2] (10.8) 
10 
因此 | 
m p F 
507 T(N) = Tib?) ef (10.9) 


如 果 ap, NEA IH ASUNT: 1 的 几何 级 数 。 由 于 无 穷 级 数 的 和 收 敏 于 一 个 党 
数 , 因此 该 有 穷 级 数 也 以 一 个 常数 为 界 , 从 而 方程 (10.10) 成 立 : 
TIN) = Ola") = O(q P N) = O(N Pe) (10.10) 
如 果 ah, 那么 和 中 的 每 一 项 均 为 1。 由 于 和 含有 1+ logwV 项 而 a = ^ 意味 着 boga = k, 
于 是 
T(N} = Ola” log, N) = O(N®8 log, N) = O(N* log, N) 
= O(N* logN) (10.11) 
BE., WE acb, PAZLAR PRTRÆEAF 1. HL 1.2.3 中 的 第 二 个 公式 成 立 。 
我 们 得 到 
T(N) = qra 1 = O(a"(b*lay") = OUB”) = O(N*) (10.12) 
(b*/a) — 1 
定理 的 最 后 一 种 情形 得 证 . 
作为 一 个 例 了 , 归并 排序 有 a-5-2R &-1. 第 二 神情 形成 并 ， 国 此 答案 为 O(N log N)。 
如 果 我 们 求解 三 个 问题 , 每 个 问题 都 是 原始 大 小 的 一 半 , 使 用 O(N) 的 附加 工作 将 解 联合 起 
X. 则 a=3, 5=2 而 =1。 此 处 情形 1 成 立 , 于 是 得 到 界 O(N) = OCNT  )。 求 解 三 个 
于 大 小 的 问题 但 需要 OCN?) 了 作 以 合并 解 的 算法 将 需要 O(N?) 的 运行 时 间 , 因为 此 时 第 
三 种 情形 成 立 。 
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有 两 个 重要 的 情形 定理 10.6 没有 包括 ., 我 们 再 叙述 两 个 定理 , GWAR FAS. 定理 
10.7 推广 了 前 面 的 定理 。 

定理 10.7 
方程 TONO =aT(N/b) + GC N log? ND BIRA 

ONE) E ab 

T(N) - Jot Nog? IN) a=b 

Ot N*log?N ) Hach 
其 中 221, 5 >1 H p20., 
定理 10.8 


如 全 $5 ia <1, WAG TONJ=™NEL TaN) + OUN) RA TON) =OCN). 
10.2.2 最 近 点 问题 


我 们 第 一 个 问题 的 输入 是 平面 上 的 点 列 PS WER pi 二 (ri, yi pom (G2. y2), 那么 
p, 和 p> 间 的 欧 几 里 德 距 离 为 [(z 7 22)? + Con yy ^. 我 们 需要 找 出 一 对 最 近 的 点 有 —— 
可 能 两 个 点 位 于 相同 的 位 置 ;在 这 种 情形 下 这 两 个 点 就 是 最 近 的 , 它们 的 距 高 为 零 。 

如 果 存 在 N 个 点 ,那么 就 存在 NON -1)/2 对 点 间 的 距离 。 我 们 可 以 检查 所 有 这 些 距 
离 , 得 到 一 个 很 短 的 程序 , 不 过 这 是 一 个 花费 O(N WERK. 由 于 这 种 方法 是 一 种 详尽 的 搜 
3&. 因此 我 们 应 该 期 望 做 得 更 好 一 些 。 

假设 平面 上 这 些 点 已 经 按照 z 的 坐标 排 过 序 , 最 差 也 只 不 过 在 最 后 的 时 间 民 上 仪 多 加 了 
O(N log NI) 而 已 。 由 于 将 证 明 整 个 算法 的 OON log NDF, 因此 从 复杂 度 的 观点 来 看 ,该 排 
序 基 本 上 疫 增加 时 间 消 耗 的 级 别 。 

图 10-29 画 出 一 个 小 的 样本 点 集 P 既然 这 些 点 已 按 z 坐标 排序 , 那么 我 们 就 可 以 画 一 
ZARIE, PERIERE: Pp WM Pp. 这 做 起 来 当然 简单 . 现在 我 们 得 到 的 情形 几乎 和 
我 们 在 2.4.3 节 的 最 大 子 序列 和 问题 中 见 过 的 情形 完全 相同 。 最 近 的 一 对 点 或 者 都 在 Pi P, 
或 者 都 在 PrP, 或 者 一 个 在 PL 中 而 另 一 个 在 Pr "P. 证 我 们 把 这 三 个 距离 分 别 呀 做 dr. dg 
Al de. 图 10-30 显示 出 点 集 的 分 化 和 这 三 个 距离 。 


n a 


图 10-20 一 个 小 规模 的 点 集 图 10-30 被 分 成 忆 AP, PREP. 
At ir Rees 
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我 们 可 以 递归 地 计算 d, 和 ds。 本 问题 此 时 就 是 = 
计算 de. 由 于 我 们 想 要 一 个 O(N log NASAR, 因此 
我 们 必须 能 够 仅仅 多 花 口 (N) 的 附加 工作 计算 出 df。 E 
我 们 已 经 看 到 ， 姐 果 一 个 过 程 由 两 个 一 半 大 小 的 递归 | 
调用 和 附加 的 ON) 工作 组 成 , 那么 总 的 时 间 将 是 "EL 
OCN log NJ, 

^ $-min(di, dg), 我 们 的 第 一 个 观察 结论 是 ， 
QR do 对 8 有 所 改进 ,那么 我 们 只 需 计 算 SG. MR 
de 是 这 样 的 上 距离 ， 则 定义 de 的 两 个 点 必然 在 分 割 线 
He 距离 之 内 ;我 们 将 把 这 个 区 域 叫 做 一 条 带 {strip)。 
如 图 10-31 Sas, 这 个 观察 结果 限制 了 需要 著 虚 的 点 
的 个 数 ( 比 例 中 的 8= dg. 

有 两 种 方法 可 以 用 来 计算 does 对 于 均 名 分布 的 大 型 点 集 , 预计 位 于 该 带 中 的 所 的 个 数 足 
非常 少 的 。 BSE, 容易 论证 平均 只 有 ON ) 个 点 是 在 这 个 带 中 。 因此, RMON) 
时 间 对 这 些 点 进行 蛮 力 计算 。 图 10- 32 中 的 的 代码 实现 该 方法 ， 其 中 按照 C 语 天 的 约定 ， 反 
B3 FERMA 0 HHR 





i 
， Ne 








图 10-31 METK, uA 
对 于 de TRENERA 


/* Points are al! in the strip */ 


for( i = GO: 1 < NumPointsInStrip; i++ 3 
fort j = i + L; J < NumPointsInStrip; j++ 1 
if Dhati P, P) S é } 





A= Feel P P); 
1369 
my 图 10-32. min (6, d OBSS ZEE 
37 


在 最 坏 情形 下 , SUGAR TAB ABER APRN, ORT TAS RE DLE TERT lai 
行 。 我 们 可 以 用 下 列 的 观察 结果 改进 这 个 算法 : 确定 de ATAR y 坐标 差别 最 多 是 8. 合 
Wj, de 8. 设 带 中 的 点 按照 它们 的 y 坐标 排序 。 因 此 , 如 果 p, Alp, 的 ? BEKT’, AB 
么 我 们 可 以 继续 处 理 p; ;1 这 个 简单 的 修改 在 图 10-33 中 实现 。 


/* Points are all in the strip and sorted by y coordinate */ 


fort i = 0; i < NumPointsInStrip; i++ ) 
for( j= i+ 1; j < NumPointsInStrip; j++ 3 


if( P, and P,'s coordinates differ by more than à ) 
break; /* Go to next P,. */ 

else 

ifi DutP bo c) 
6 = Dsl, Pay 





图 10 33 min (4, dH i 


这 个 附加 的 测试 对 运行 时 间 有 着 显著 的 影响 , 因为 对 于 每 一 个 记 , 在 pi 和 pp 的 y 坐标 
相差 大 于 8 RGR AE for 循环 以 前 , 只 有 少数 的 点 p, 被 考查 。 例 如 , 图 10-34 on 
108 p. 只 有 两 个 点 pa 和 ps TÀ foe SPE 8 ZA BU ARDC RY. 

对 于 任意 的 点 b, 在 最 坏 的 情形 下 最 多 有 7 个 点 p, 被 考虑 。 这 是 因为 这 些 点 必定 沙 和 在 
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VE AK RACE RRSP OX 8 TRAR ARE AR RAE RU OX 6 方块 内 - AD 
面 , FR axe ARARNAR ELOA A. HRT P. 每 个 方块 包含 4 个 点 , 每 
个 角 上 一 个 点 - 这 些 点 中 有 一 个 是 pu. RELER T 7 个 点 要 考虑 。 最 坏 情 形 的 状况 见 10-35 


所 示 。 TER. AIR poA pus A RREI. 但 它们 可 以 是 不 局 的 点 。 对 于 实际 的 分 析 来 说 ， 
惟一 重要 的 是 Ax 24 的 矩形 区 域 中 的 点 的 个 数 为 口 ([ ,这 当然 很 清楚 。 








P P | Pm Paz 
do i 
T Left half (A x A) Right half (À x A) 
y 
&— B 863 Pra Pra Pio Pra 
图 10-34 在 第 二 个 for PAA 图 10-35 最 多 有 8 个 点 在 该 拭 形 中 
只 有 ps 和 ps REE 有 两 个 坐标 此 中 从 个 都 由 两 个 点 分 享 


因为 对 于 每 个 p 最 多 有 了 个 点 要 考虑 , 所 以 计算 比 人 好 的 df MITE OCN). 因此 ， 
苦于 两 个 一 半 大 小 的 递归 调用 加 上 联合 两 个 结果 的 线性 附加 工作 , 看 来 我 们 似 竺 对 最 近 点 间 
题 有 一 个 O(N log N) AB. 然而 , 我 们 还 没有 真 赴 得 到 O(N log NOBSRE. 

问题 在 了 于, 我 们 已 经 假设 这 些 点 按照 y 坐标 排序 是 现成 的 。 如 时 对 于 每 个 北山 调用 我 们 
都 执行 这 种 排序 ,那么 我 们 又 有 OON log N) 的 附加 工作 : 这 就 得 到 一 个 O(N log NRE. 
不 过 问题 还 不 全 这 么 糟 , 尤其 在 和 蛮 力 O(N?) 算 法 比较 的 时 候 。 然而 , 不 难 把 对 于 每 个 递归 
调用 的 工作 简化 到 OCN) ,从 而 保证 O(N log NOFA 

我 们 将 保留 两 个 表 。 一 个 是 按照 x 坐标 排序 的 点 的 表 , 而 另 一 个 是 按照 y 坐 慰 排 序 的 扎 风 
Se 我 们 分 别称 这 两 个 表 为 P 和 Q. 这 两 个 表 可 以 通过 一 个 预 处 理 排序 步骤 花费 OUN log N) 
得 到 ,因此 并 不 影响 时 间 界 。P 和 是 传递 给 左 半 部 分 递归 调用 的 参数 表 ,，Px Qs lète 
说 给 在 半 部 分 递归 调用 的 参数 表 .。 我 们 已 经 看 到 , P 很 容易 在 中 间 分 开 。 一 旦 分 割 线 已 知 ， 
我 们 依 序 转 到 Q. 把 每 一 个 元 素 放 人 相应 的 Q; BY Qn c 容易 看 出 ' Q; Fl Qe 将 E Sig y 
SARH, "4E US Fa EIN, 我 们 扫描 Q 表 并 删除 其 x 坐标 不 在 带 内 的 所 有 的 扩 。 此 时 Q 
只 含有 带 中 的 点 ， 而 这 些 点 保证 是 按照 它们 的 y 坐标 排序 的 。 

这 种 策略 保证 整个 算法 是 OCN log NBS, 因为 只 执行 了 OCNY) 的 附加 工作 . 
10.2.3 选择 问题 ‘ 

沈 择 问题 (selection problem) 要 求 我 们 找 出 含 N 个 元 素 的 表 S 中 的 第 A UBICA. 
我 们 对 找 出 中 间 元 素 的 特殊 情况 有 着 特别 的 兴趣 , 这 种 情况 发 生 在 & =[ N72 Bm fi. 

在 第 1 章 、 第 6 章 和 第 7 章 我 们 已 经 看 到 过 选择 问题 的 开 个 解法 : 第 了 章 中 的 解法 用 到 
快速 排序 的 变 体 并 以 平均 时 间 OCN DIT. 事实 上 , EE Hoare 论述 快速 排序 的 原始 论文 中 
已 有 描述 .。 
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FRAP RIE Dee GZ 45, (AREA OOCN*) AUR. 通过 把 元 素 排 
FE. 选择 可 以 容易 地 以 OON log NN) 最 坏 情 形 时 间 解 决 , A, RA A DEBE EBENE 
以 O(N ) 最 坏 情 形 时 间 完 成 。 在 7.7.6 节 概 述 的 快速 选择 算法 在 实践 中 是 相当 有 效 的 ,内 此 
这 个 问题 主要 还 是 理论 于 的 问题 - 

我 们 知道 ,基本 的 算法 是 简单 递 遇 策略 。 设 N 大 于 截止 点 (eutoft point), 在 截止 点 后 苞 素 
将 进行 简单 的 排序 . o 是 选 出 的 一 个 元 素 , 叫做 枢纽 元 (pivot)。 其 余 的 邢 素 被 放 在 岗 个 集合 S 
AS. 中. S, 会 有 那些 不 大 于 v HUCK, 而 So 则 包含 那些 不 小 十 o 的 元 素 。 Ba, WR 
REIS, MBA S pR: 个 最 小 的 元 素 可 以 通过 递归 地 计算 Si 中 第 上 个 最 小 的 元 案 而 找 
到 。 如 巢 &= 1S +1， 则 枢纽 元 就 是 第 大 个 最 小 的 元 闵 。 AM. 在 S 中 的 第 个 最 小 的 元 系 
ES, pH- ISl- Debo. 这 个 算法 和 快速 排序 之 间 的 主要 区 别 在 十 , 这 里 要 
求解 的 只 有 一 个 子 问 题 而 不 是 两 个 子 问题 。 

为 了 得 到 一 个 线性 算法 , 我 们 必须 保证 子 问 题 只 是 原 问 题 的 一 部 分 , 而 不 仅仅 只 是 比 原 
问题 少 几 个 元 素 .。 当然 ,如 果 我 们 床 意 花费 一 些 时 间 查 找 的 话 , 那么 总 能 够 找到 这 样 - -个 元 
3x. 困难 的 问题 在 于 我 们 不 能 花费 太 多 的 时 间 了 寻找 枢纽 拒 。 

对 于 快速 排序 , 我 们 看 到 枢纽 元 一 种 好 的 选择 是 选取 三 个 元 素 并 原 它 们 的 中 项 , 这 就 产 
生 某 种 枢纽 元 不 太 坏 的 期 望 , 但 它 并 不 提供 一 种 保证 。 我 们 可 以 随机 选取 21 个 元 素 , 以 带 数 
时 间 将 它们 排序 , 用 第 11 个 最 大 的 元 素 作为 枢纽 元 , ASUS) BE SERE CoU. PAIN, SUE 
这 21 个 元 素 是 21 个 最 大 元 , 郑 么 枢纽 元 仍然 不 好 。 将 这 种 想法 扩展 , 我 们 可 以 使 用 真 到 
ONAN) EA, 用 堆 排序 以 DCN) 总 时 间 将 它们 排序 ， 从 统计 的 观点 看 几乎 肯定 得 到 
-个 好 的 枢纽 元 . 不 过 , 在 最 坏 情形 下 , 这 种 方法 行 不 道 ， 因为 我 们 可 能 选择 OCN /og 入 ) 个 
最 大 的 元 素 , 而 此 时 的 枢纽 元 则 是 第 LN — O(N AogN)] 个 最 太 的 元 素 , 这 不 是 N 的 一 个 常 
Tm. 

然而 ,基本 想法 还 是 有 用 的 。 的确, 我 们 将 看 到 , 可 以 用 它 来 改进 快速 选择 所 进行 的 比 
较 的 期 望 次 数 。 但是， 为 得 到 一 个 好 的 最 坏 情形 , 关键 想法 是 再 用 一 个 向 接 层 - 我 们 不 是 从 
随 视 元 豆 的 样本 中 找 出 中 项 , 而 是 从 中 项 的 样本 中 找 出 中 项 。 

基本 的 枢纽 元 选择 算法 如 下 : 

1. 把 N 个 元 素 委 成 | NA 组 , 5 个 元 素 一 组 ,忽略 (最 多 4 个 ) 剩 余 的 元 素 。 

2. 找 出 每 组 的 中 项 , 得 到 1 NAS] 个 中 项 的 表 M., 

3. 求 出 M 的 中 项 , 将 其 作为 枢纽 元 v ik ih], 

我 们 将 用 本 语 “ 五 分 化 中 项 的 中 项 ” ( median-of-median-of-five partitioning) 38 3E [88 Hj. Sa 
给 出 的 枢纽 元 选择 法 则 的 快速 选择 算法 。 现 在 我 们 证 明 ,“ 五 分 化 中 项 的 中 项 ” 保证 每 个 递归 
子 问 题 的 大 小 最 多 是 原 问 题 的 大 约 70% 。 我 们 还 要 证 明 , 对 于 整个 选择 算法 , WALE 以 是 
ag RARE IH, LURE O(N) 的 运行 时 间 。 

现在 让 我 们 假设 N 可 以 四 5 整除, 因此 不 存在 多 余 的 元 素 . 再 设 NA APA ER, 这样 M 
就 包含 奇数 个 元 素 。 我 们 将 要 看 到 ,这 将 提供 茶 种 对 称 狂 。 因此 为 方便 起 岗 我 们 假设 入 为 
105 +5 的 形式 。 我 们 还 要 假设 所 有 的 元 素 都 是 互 异 的 。 实际 的 算法 必须 保证 能 够 处 理 该 假设 
不 成 立 的 情况 。 图 10-36 指出 当 N= 45 时 , 枢纽 元 如 何 能 够 选 出 。 

在 图 10-36 中 ,wv 代表 该 算法 选 出 作为 枢纽 元 的 元 素 。 由 于 v 是 9 个 元 素 的 中 项 ， 而 我 
们 假设 所 有 元 素 互 异 ， 因 此 必然 存在 4 个 中 项 大 于 o 以 及 4 个 小 于 ve 我 们 分 别 用 上 MS X 
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示 这 些 中 项 。 考 虑 具有 一 个 大 中 项 { 工 型 ) 的 五 元 素 组 . 该 组 的 中 项 小 于 组 中 的 男 现 个 元 素 量 
大 于 组 中 的 另 两 个 元 素 . 我 们 将 令 WARIS SULA. 存在 一 些 已 知 大 于 一 个 大 中 项 的 元 
RB. AH, 工 代 表 那 些小 于 一 个 小 中 项 的 元 娄 , 存在 10 个 HURR: 具有 工 型 中 项 的 
每 组 中 有 了 两 个 ,wv AEA TUR RT. 类似 地 , 存在 10 个 了 型 元 素 。 


5 无 素 的 排序 条 组 


~ 













w= 000000000 


图 10-36 枢纽 元 的 选择 


7 型 元 素 或 日 型 元 素 保证 大 于 vw, 而 S 型 元 素 或 了 型 元 素 保 证 小 于 wv。 于 是 在 我 们 的 问 
题 中 保证 有 14 SACHA 14 SICH. 因此 , 递归 调用 最 多 可 以 对 45- 14-1 =30 tX 
进行 - 

证 我 们 把 分 析 推 广 到 对 形 如 10&+5 的 一 般 的 N 的 情形 。 在 这 种 情况 下 , 存在 个 上 型 
FH Ake SS 型 元 素 , 存在 28+2 个 日 MR, 还 有 2k+2 个 个 型 元 素 , 内 此 , 有 3&+2 个 
元 素 保 证 大 于 v 以 及 3k +2 个 元 素 保 证 小 于 vw。 于 是 在 这 种 情况 下 递归 调用 最 多 可 以 包含 
1à 452 <0.7N THRE. WE N 不 是 10k 5 的 形式 , 类 似 的 论证 仍 可 进行 而 不 影响 基本 
AE. 

3 64 [al AE RH EL FT EE IRL RO RR AEA OER. 我 们 可 以 以 常数 时 
ARE 5 元 素 的 中 项 。 例如 , 不 难 用 8 次 比较 将 5 个 元 素 排序 。 我 们 必须 进行 LN 人 J 次 这 样 
的 运算 ,因此 这 一 步 花 费 OCN) 时 则 。 然后 我 们 必须 计算 LN 5] 元 素 组 的 中 项 。 明显 的 做 法 
是 将 该 组 排序 并 返回 中 间 的 元 素 。 但 这 需要 花费 O(LN/5] log LN/S D) = OCN log N) 的 时 
i]. 因此 不 能 这 么 做 , 解 次 方法 是 对 这 LN 75) 个 元 素 递 岂 调用 选择 算法 ， 

现存 对 基本 算法 的 描述 已 经 完成 。 如 果 想 有 一 个 实际 的 实现 方法 , 那么 还 有 某 些 纳 市 仍 
然 需要 填补 。 例 如 ,重复 元 必须 要 正确 地 处 理 , 该 算法 需要 截止 点 足够 大 以 确保 递归 调用 能 
能 进行 。 由 于 涉及 到 相当 大 量 的 系统 开销 , 而 且 该 算法 根本 不 实用 , AURIA EHRE TE 
何 细节 ,即使 如 此 , 该 算法 从 理论 的 角度 来 看 仍然 是 一 种 突破 ,因为 其 运行 时 间 在 基 坏 情形 
下 是 线性 的 , 正如 下 面 的 定理 所 述 。 


定理 10.9 
使 用 “五 分 化 中 项 的 中 项 ”的 快速 选择 算法 的 运行 时 间 为 O(N )。 
证 明 : 


该 算法 由 大 小 为 0.7N 和 0.2N 的 两 个 递归 调用 以 及 线性 附加 工作 组成。 根据 定理 
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10.8, 其 运行 时 间 是 线性 的 。 
降低 比较 的 平均 次 数 
E 分 治 算法 还 可 以 用 来 降低 选择 算法 预计 所 需要 的 比较 次 数 。 让 我 们 看 一 个 具体 的 例子 - 
379 设 有 1000 个 数 的 集合 S 并 呈 归 寻找 其 中 第 100 个 最 小 的 数 X. 我们 选择 S TES. EH 
100 个 数组 成 。 我 们 期 望 X 的 值 在 大 小 上 类 似 于 S’ 的 第 10 个 最 小 的 数 , 尤其 是 S 的 第 5 个 
最 小 的 数 儿 平 肯定 小 于 X, mS 的 第 15 个 最 小 的 数 几 乎 肯定 大 于 X. 
出 - 般 地 ,从 N 个 元 素 选 取 s 个 元 素 的 样本 S'. S 8 EPR, 后 惫 我 们 将 选择 它 使 每 把 
该 过 程 所 用 的 平均 比较 次 数量 小 化 。 我 们 找 出 S' 中 第 (v1 = bs /N - 6) TS oS kN + 8) 
个 最 小 的 元 素 。 几乎 可 以 肯定 S 中 的 第 个 最 小 元 素 将 落 在 vi 和 vo 之 间 , 因此 和希 给 我 们 的 
是 关于 28 个 元 素 的 选择 问题 , 第 点 个 最 小 元 素 不 落 在 这 个 范围 内 的 概率 很 低 ， 而 我 们 有 大 
HO TEE, 不过, 只 要 和 6 选择 得 好 , 根据 概率 论 的 定律 我 们 可 以 肯定 , 第 二 种 情形 对 
于 整体 工作 不 会 有 不 利 的 影响 。 
如 时 进行 分 析 ， 那么 我 们 就 会 发 现 , 车 = N log N 和 6 = N'^log ON, 则 期 望 的 比 
Boe Bey N +k + ON log! N), 除 低 次 项 外 它 是 最 优 的 。 GIR k > N2, 那么 我 们 可 以 
考虑 查找 第 (NN - 衣 ) 个 最 大 元 素 的 对 称 问题 。) 
大 部 分 的 分 析 都 容易 进行 。 最 后 一 项 代表 进行 两 次 选择 以 确定 v, 和 o» 的 代价 。 COUR 
用 合理 聪明 的 策略 , 则 划分 的 平均 代价 等 于 N 加 上 在 S 中 的 期 望 阶 (expected rank), Bil 
N+h+ OUNS/s)o 如果 第 上 个 元 素 存 $' 中 出 现 , 那么 结束 算法 的 代价 等 于 对 S 进行 选择 
的 代价 , BLOGO, WRA E 个 最 小 元 素 不 在 S "中 出 现 ,那么 代价 就 是 O(N). RM., sMs 
己 经 被 选取 以 保证 这 种 情况 以 非常 低 的 概率 of17ZN) 发 生 ,， 因此 该 可 能 性 的 期 望 代价 是 ot1)， 
TON 越 来 越 大 时 趋向 于 0。 一 种 精确 的 计算 留 作 练习 10.21. 
这 个 分 析 指 出 ， 找 出 中 项 平均 大 约 需要 1.5N 次 比较 。 当 然 , 该 算法 为 计算 s GRAS 
xm. 这 在 一 些 机 器 上 可 能 使 该 算法 减 惕 速度 。 不 过 即使 是 这 样 , 经 验 已 经 证 明 ， #7 HE IE m 
空 现 , 则 该 算法 完全 能 够 比 得 上 第 7 章 中 人 快速 选择 实现 方法 。 
10.2.4 一 些 运 算 问题 的 理论 改进 
在 这 -一 节 我 们 描述 一 个 分 治 算法 , 该 算法 是 将 两 个 N ORE. 我 们 前 面 的 计算 模型 假 
设 乘法 是 以 常数 时 间 完 成 ,因为 乘 数 很 小 。 对 于 大 的 数 ， 这 个 假设 不 再 有 效 。 如 果 我 们 以 来 
数 的 大 小 来 衡 晨 乘法 , ABS GRAD FEE BIS ERE A Tal, 而 分 治 算法 则 以 亚 二 次 (sub- 
duadratic) 时 间 运 行 。 我 们 还 介绍 经 典 的 分 治 算法 ， 它 以 亚 立 方 时 间 将 两 个 N x N EER. 
整数 相 乘 
376! 设 我 们 想 要 将 两 个 N 位 数 X ALY FAR. AE x MY 恰好 有 一 个 是 负 的 , 那么 结果 器 是 
负 的 ;否则 结果 为 正 数 。 内 此 , 我 们 可 以 进行 这 种 检查 然后 假设 XX，Y 之 0。 几乎 每 一 个 人 在 
手 算 乘法 时 使 用 的 算法 都 需要 ONOKE, 这 是 因为 X 中 的 每 一 位 数字 都 要 被 了 的 每 一 
(BR HEA BA. 
WE X= 61 438 521 而 Y 294736 407, 那么 XY =5 820 464 730 954 O47. ibi HEX H Y 
拆 成 两 半 , 分 别 由 最 高 几 位 和 景 低 凡 位 数学 组 成 。 此 时 ,Xr = 6143, Xk 8521, Y= 9473, 
Y,-6407. 我 们 还 有 外 一 XL10 + XR VAR Y= Yr104 + Yk。 由 此 得 到 
XY = X,YL 10 + (XLYp + XeYL 10! + XrYR 
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注意 ,这 个 方程 由 4 次 乘法 组 成 , 即 XiY, X Ys. XsY, 利 XRYe， 它们 每 -个 郁 是 原 


问题 大 小 的 一 六 (N72 数字 )。 用 10 和 10 和 作 乘 法 实际 就 是 添加 一 些 0, 这 及 共 乒 的 几 次 加 
法 只 是 添加 了 OCN}) 附 吉 的 工作 ,; 如 果 我 们 递 帆 地 使 用 该 算法 进行 这 4 项 乘法 ,在 一 个 适当 
的 基本 情形 下 停止 , 那么 我 们 得 到 递归 
TON) -4T(N2)4+ 00N) 
从 定理 10.6 RIDAR, TN) = OOCN-) ,因此 很 不 幸 我 们 没有 改进 这 个 算法 为 了 得 到 
-个 亚 二 次 的 算法 , 我 们 必须 合用 少 于 4 次 的 递归 调用 ， 基 甸 的 观察 结 则 中 
XLYr + XgyY, — (X; — Xr) (Yr YL) + XLYL+ XRYR 

是 , 我 们 不 用 两 次 乘法 来 计算 (O^ 的 系数 ， 而 可 以 用 一 次 乘法 再 加 上 已 经 完成 的 两 次 

Fe ASE. 图 10-37 演示 如 何 只 需求 解 3 次 递归 子 问题 。 


i 


HAARE C 


58 192 639 TIN; 
54 594 047 T(NI: 








DD; 7 290 948 Tins) 


120 077 634 CAN: 
| 54 594 047 Fic Eg 
1 200 776 340 000 OIN) 


l 
5 819 263 900 000 DOO OIN) | 


5 R20 464 730 934 047 OIN i 


图 10-37 分 治 算法 的 执行 情况 


Kivi r D1 ^OXkYR 





容易 看 到 现在 的 递归 方程 满足 
T(N) -3T(N72) * O(N) 

MARTHA TON) = ON) = O(N 79), SER GIA, RIMA — PTET 
况 ， 该 情况 可 以 无 须 递 妇 而 解决。 

当 两 个 数 都 星 一 位 数字 时 , 我 们 可 以 通过 查 表 进 行 乘法 : 基 有 一 个 乘 数 为 0、 则 我 们 返 四 
0 假如 我 们 在 实践 中 要 用 这 种 算法 ,那么 我 们 将 选择 对 机 器 最 方便 的 情况 作为 基本 情 次 

虽然 这 种 算法 比 标准 的 二 次 算法 有 更 好 的 渐进 性 能 , 但 是 它 却 很 少 使 用 , 因为 对 于 小 的 
N 开销 大 , 而 对 大 的 N 甚至 还 存在 更 好 的 一 些 算法 。 这 些 算法 也 广泛 利用 了 分 治 算法 。 
EERE 

_ .个 基本 的 数值 问题 是 两 个 矩阵 的 乘法 。 图 10-38 给 出 一 个 简单 的 O(N) 算法 计算 
C= AB. 其 中 A, B 和 C 均 为 N NIER. 该 算法 直接 来 自 于 乍 阵 乘 法 的 定义 ， 为 了 计算 
C, 我 们 计算 A 的 第 i 行 和 B 的 第 7 列 的 点 来 。 按照 通常 的 惯例 ,数组 下 标 均 从 0 开 如 。 
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/" Standard matrix multiplication */ 
A Arrays start at Ù */ 


void 
| MatrixMultiply£ Matrix A, Matrix B, Matrix C, int M ) 
| int 1, j. Kk; 
for( i 20; 1 < N; i++ } /* Initialization */ 
fort j= 0; j < Mj j++ ) 
€[ 3103] J = 0.0; 


for( i =O; i < N; i++ } 


for( j= 0; 3 < N; je } 
fort k = 0; k < Ny ke 3 
Cli JL ji] += ALi Ek 1 * BE k Jia]: 





图 10-38 简单 的 OC NOBIS 


E KHAO e S RE PEE D S HLE QN?) RB. SRI, 在 20 M 加 年 代 末 Strassen 
378; Rute T pk QONO)BUBE BE, Strassen 算法 的 基本 想法 是 把 每 一 个 完 阵 都 分 成 4 块 ， 如 图 
10-39 Bran. 此 时 容易 让 明 





»n M Br] = [ee e 


Ax, Arl Baii Cu Caa 


图 10-39 $E AB= C HRR 4 RR 


Cia 7AB t A2821 

CaF Aia Bi * Ai aoB2 

C217 Áo Brit A222821 

C57 A21B1,2 * Ao2B2,2 
作为 -个 例子 ， 为 了 进行 滋 法 AB 





3 4 1 6][5 6 9 3] 
]12537)]4531 
mls. 2 vis 4 
3 5 613 1 4 1 


我 们 定义 下 列 8 个 N/2 x N/2WIBRE: 


3 4 [1 S P J -[? 3] 
一 一 一 B 一 
Aji b | A1, P 7 By 4 5 27], | 


E self ned sed 
Aul, ; Analg gj PIA [5 1 22 lad 


ent. 我们 可 以 进行 8 NOX NZ2 BREA 4 PNK N72 阶 和 矩阵 的 加 法 。 这 些 
加 法 花费 OUN2) 时 间 。 如 果 递 归 地 进行 矩阵 乘法 ,那么 运行 时 间 满 足 
TON) -BT(UNZ2) + O(N?) 
从 定理 10.6 RURA TON) = OCN3), 内 此 我 们 没有 作出 改进 。 如 同 我 们 人 在 整数 来 法 
Bale), 我 们 必须 把 子 问题 的 个 数 简化 到 8 个 以 下 。Strassen 使 用 了 类 似 于 整数 乘法 分 治 算 
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法 的 -种 策略 并 指出 如 何 仔细 地 安排 计算 而 只 使 用 了 次 递归 调用 。 这 7 个 乘法 是 
M,-(A,52- As (B+ Bo) 
M;-(A,4,* A22) (B, + B22) 
M;-(GA, 41-7 Az) (Biat Bi,2) 
M,=(A, 11 A2) Boo 
Ms = Aj 4 (B4 5 B22) 
Ms; = A; s(Bs 7 Bry) 
M;-(A»4 +t À235) Bia 
一 日 执行 这 些 乘 法 ， 则 最 后 答案 可 以 通过 下 列 8 次 加 法 得 到 
C,; 7M, * V5- Mit Me 
C,;-M,* Ms 
Ca, = Mi + Mp 
C= Mo- M:t M; - Mj 
直接 验证 这 种 机 敏 的 安排 得 到 期 望 的 效果 。 现 在 运行 时 间 广 足 递 归 关 系 
T(N)-7TUN 72) + O(N?) 
这 个 递归 关系 的 解 为 T(N})= OCNPS) 2 O(N 3). 

如 往常 一 样 , 有 些 细 节 需 要 考虑 , 如 当 N 不 是 2 的 宕 时 的 情况 ,不 过 还 是 有 些 根本 性 小 
tte. Strassen 算法 在 N ASABE AB GUE REAR. EAN EE Be CB SA 
许多 的 0 元 素 ) 的 情况 , 而 且 它 还 不 容易 并 行 化 。 当 用 浮 点 数 运算 时 , 在 数值 上 它 不 如 经 典 的 
等 法 稳定 。 因此 , 它 只 有 有 限 的 适用 性 。 AM, 它 象征 着 重要 理论 的 里 程 眉 并 证 明了 上 ， EIT 
机 科学 像 在 许多 其 他 领域 一 样 ， 即使 一 个 问题 看 似 具 有 固有 的 复杂 性 , 但 在 被 证 明 以 前 却 始 
终 不 可 定论 。 


10.3 动态 规划 


在 前 一 节 , 我 们 看 到 一 个 可 以 被 数学 上 递归 表示 的 问题 也 可 以 表示 成 一 个 递归 算法 , 在 
许多 情形 下 对 朴素 的 穷 举 搜索 得 到 显著 的 性 能 改进 。 

任何 数学 递归 公式 都 可 以 直接 翻译 成 递归 算法 . 但 是 基本 现实 是 编 详 器 常常 不 能 正确 对 
待 递归 算法 , 结果 导致 低 效 的 算法 。 当 我 们 怀疑 很 可 能 是 这 种 情况 时 ,我 们 必须 再 给 编译 涡 
提供 一 些 帮助 , 将 递归 算法 重新 写成 非 递归 算法 , 让 后 者 把 那些 子 问题 的 答案 系统 地 记录 秦 
-个 表 内 。 利用 这 种 方法 的 一 种 技巧 叫做 动态 规划 (dynamic programming } » 
10.3.1 H—^4 XI BA 

在 第 2 章 我 们 看 到 , HA Re EN. 回忆 图 10-40 Bs 
的 程序 的 运行 时 间 TON RAE TON) > T(N- 1)+T(N-2). 由 于 TCN) 作 为 斐 波 那 回 数 
满足 同样 的 递归 关系 并 具有 同样 的 初始 条 件 , 因此 ,事实 上 TCND RUSS RA 
速度 在 增长 从 而 是 指数 级 的 。 

另 一 方面 , 由 于 计算 Fw 所 需要 的 只 是 Fy. 1 和 Fy, 因此 我 们 只 需要 记录 最 近 算出 的 
两 个 斐 波 那 契 数 。 这 导 敏 图 10-41 中 的 O(N) RR. 


379 


= 
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| /*" Compute Fibonacci numbers as discussed in Chapter 1 */ 


int 
Fibt{ int N } 
{ 


return Fib( N- 13 + Fib( N- 2 3; 


| 
ü 


图 10-40 HRW PRR HERR 









int 
Fibonaccit int N 5 
{ 
int i, Last, NextToLast, Answer, 


| ift N <= 1) 

| return 1; 

‘ Last = NextToLast = 1; 

| fort i = 2; i <= N; de) 

| 
Answer = last + NextToLast; 
NEXtTOLaSt = Last; 

| Last = Answer: 


} 
return Answer; 
} 


10-41 计算 韭 波 那 架 数 的 线性 算法 


递归 算法 如 此 慢 的 原 下 在 于 算法 模仿 了 递归 .为 了 计算 Fs. 存在 一 个 对 Fw.1 利 FN a 
的 调用 . 然而 . 由 于 Fj 递归 地 对 PY M Py :进行 调用 ， 因此 存在 两 个 单独 的 计算 OBS -a 
的 调用 。 如果 探 试 整个 算法 ,那么 我 们 可 以 发 现 ，F、; 被 计算 了 3 次 , Fv-s 计 算 了 5 次 .而 
E. A) E Blk. 等 等 。 如 图 10-42 Bras, 元 余 计算 的 增长 是 爆炸 性 的 。 如 果 编 译 占 的 递 妇 模 
拟 算法 查 是 能 够 保留 一 个 预先 算出 的 值 的 表 而 对 已 经 解 过 的 子 问题 不 再 进行 递归 调用 ,那么 
387 这 种 指数 式 的 爆炸 增长 就 可 以 避免 。 这 就 是 为 什么 图 10-41 中 的 程序 如 此 有 效 的 原因 。 


pe ie 
^ Fd u 
RITE FP CH p "E FI “RO 
p^ Cn m CQ E ‘Fo Fl “FO 
Fl F0 


图 10-42 ”跟踪 斐 波 那 契 数 的 递归 计算 
作为 第 二 个 例子 ,我 们 看 到 第 7 章 中 如 何 求解 递归 关系 CON) = (2/N) J aC + 
N. 其 中 C00) = 1, 假设 我 们 想 要 检查 所 得 到 的 解 是 否 在 数值 上 是 正确 的 ， 此 时 我 们 可 以 浓 
R 10-43 中 的 简单 程序 米 计算 这 个 递归 问题 。 
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| double 
Evalt int N ) 
1 


int i; 
double Sum; 
iff N == D } 
return 1.0: 
else 
i 
Sum = 0.0; 
for( 7 = 0; 1 < N; 1++ 3 
Sum += Eval€ 1 5: 
return 2.0 * Sum / M + N; 


| 
| 
图 10-43 计算 CEN) = (2AN) CG) + N 的 值 的 递归 程序 


这 里 , 递归 调用 又 做 了 重复 性 的 工作 。 在 这 种 情况 下 ,运行 时 间 TONAL TON) = 
M. T(i) N ,因为 如 图 10-44 Prim, 对 于 从 10 39] N — 1 ABARAT (BRIN 238 
HRE, Sh OCNORUER WT AE Cc Ed 10-44 Bron B8 pr PRR BB?) 对 TON ) 求 
ERDER, 它 的 增长 是 指数 式 的 。 通过 使 用 一 个 表 , 我 们 得 到 几 10-45 中 的 程序 。 这 个 各 
序 避 免 了 宛 余 的 递归 调用 而 以 ONAT., 它 并 不 是 一 个 完美 的 程序 ,作为 练习 .你 楼 对 它 
做 些 简 单 修改 ,把 它 的 运行 时 间 简 化 到 O(N )。 


a 
CA———7 "d Sec 
c So "4 Me "4 Yo s 


cf tx a to to a to t to 
ÁN N N N 
cf cw oe CO co 
o 


图 10-44 REAR Eval 中 的 递归 计算 


10.3.2 和 矩阵 乘法 的 顺序 安排 

He EU MEM A.B. CHD, A 的 维 数 = 50x10, B 的 维 数 = 10x40, C 的 维 数 = 
40x30, D 的 维 数 = 30x5。 虽 然 矩阵 乘法 运算 是 不 可 交换 的 , 但 是 它 是 可 结合 的 ， 这 就 音 
味 着 垂 阵 的 乘积 ABCD 可 以 以 任意 顺序 添加 括号 然后 再 计算 其 值 。 将 两 个 阶 数 分 别 为 px 9 
Ang r WERTER, EH por 次 标量 乘法 。( 由 于 使 用 请 如 Strassen 算法 这 样 的 理论 上 
优越 的 算法 并 没有 明显 地 改变 我 们 要 考虑 的 问题 ， 因此 我 们 将 假设 这 个 性 能 的 界 . ) 那 么 , 计 
B ABCD 需要 执行 的 二 个 矩阵 乘法 的 最 好 方式 是 什么 ? 

在 四 个 矩阵 的 情况 下 , 通过 穷 举 搜索 求解 这 个 问题 是 简单 的 ， AAA LAH ARK 
法 排 硕 序 。 我 们 对 每 种 情况 计算 如 下 : 

。(A((CBC)D)); 计算 BC 需要 10 x40 x 30 = 12 000 KÆ. 计算 {BC)D Im (fs e 

12 000 次 乘法 计算 BC, 外 加 10 x 30x 5 = 1 500 KRH, 合计 13 500 RIE. SK 
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"^ double 
Evalf int M ) 
1 


int 3, j; 
double Sum, Answer; 
double *C; 


C = malloct sizeof¢ double } * ( M+ 131 X; 
ift € == NULL } 
Fatal—rror( "Out of space!!!" »; 


€ it j+ } 
Sum a= C[ j J; 
C[ i } = 2.0 * Sum / 3 + d; 
} 


| Answer = C[ N ]; 
| freec C }: 


return Answer; 
} 


图 10-45 使 用 -- 个 表 来 计算 CON) = 2/N SL CCGD + N BS48 





(A(B(CD))): 计算 CD 需要 40x30xs=6000 RR, HA BC CDO B9B 865 6 000 
次 乘法 计算 CD, 外 可 10 x 40x 5=2 000 MRE, Ai 8 000 IX 3€ E. SX CA CB 
(CD) ES AES E 8 000 次 乘法 计算 BCD), 外 加 50x 10x 5=2 500 MH, 总计 
10 5001 SEH: 

(( AB)(CD)): 计算 CD 需要 40x30x5=6000 次 乘法 - 计算 AB 需要 50 x 10 x 40 
—20 000 IEE. 3RCCAB)( CD) M8 9E 6 000 次 乘法 计算 CD, 20 000 XX GT 
TE AB, 9i 50x 40 5-10 000 次 乘法 ,总 计 36 000 KEH. 

((CAB)C)D): 计算 AB 3538 50x 10 x 40 2 20 000 KE., TEE AB) C. BB 22 
20 000 次 乘法 计算 AB, 外 加 50 x 40 < 30 — 60 000 KEE, Fit 80 000 次 乘法 。 求 
( CAB) C) D) KBE 80 000 次 乘法 计算 (4B)C, 外 加 50 x 30x 577 500 REI, 
总 计 87 500 次 乘法 。 

((A(BC))D): 计算 BC 需要 10x 40 x 30 — 12 000 次 乘法 , 计算 A (BC) 的 值 需 要 
12 000 次 乘法 计算 BC, 外 加 SO x 10x 30= 15 000 VOIE, 合计 27 000 MACH. OK 
(( A(BC))D) 的 值 需要 27 000 次 乘法 计算 ABC), 外 加 50X30x5=7 500 KRH, 
总 计 34 500 KBE. 


上 面 的 计算 吉明 , 最 好 的 排列 顺序 方法 大 约 只 用 了 最 坏 的 排列 顺序 方法 的 九 分 之 一 的 厂 
法 次 数 。 因 此 ,进行 一 些 计算 来 确定 最 优 顺序 还 是 值得 的 。 REM, 一 些 明 显 的 贪 禁 算法 
[382 似乎 都 用 不 上 ,而且 可 能 的 顺序 的 个 数 增长 很 快 . 设 我 们 定义 了 CN) 是 顺序 的 个 数 。 此 时 ， 
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TO) =T)=1, T3)=2, 而 T(4)=5, 正如 我 们 刚刚 看 到 的 。 一 般 地 ， 
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^ ] 
T(N) = 2 TG) TON - i) 
为 此 , BERTA Ai, Assoc. An, Be RIRE A Av S AD CA; Ayan Axe 此 
Bf. A TCA) AOKI RAA r ADHA T(N- DRIETAL 14 mo An). 因此 .对 
于 每 个 可 能 的 i 存在 TODO TUN -DADRA CA Ag A; ) (A; LIA eS Ax x 

xx PARA EES BS Catalan 数 , 该 数 呈 指数 增长 。 内 此 , 对 于 大 的 N, 穷 举 搜索 所 
有 可 能 的 排列 晨 厅 的 方法 是 不 可 行 的 。 然 而 . 这 种 计数 方法 为 一 种 解法 提供 了 基础 ,该 解法 
基本 后 足 优 于 指数 的 。 对 于 IRIN, «€ c EERE A, 的 列 数 。 于 是 A, Ae, 7. GME 
形 法 是 无 法 进行 的 。 我 们 将 定义 en 为 第 一 个 矩阵 A, 的 行 数 。 

UE pup ge Ee HEAT AR ERE E App Aron 1 Agger Ang 所 需要 的 乘法 次 数 。 为 方便 起 
K, mias tee 70. TRE BRE IE (Any tA CAL Ag). FEF Lefrszi < Right, 此 时 
所 用 的 乘法 次 数 为 Mepa T M+, Right T CLejt 1 CH Right o ix =I ay BRITS GL; AL), 
CA, art Ago AACE TSR T RHET SETS 

如 果 我 们 定义 Men gas 为 在 最 优 排列 顺序 下 所 需 鉴 的 乘法 次 数 , 那么 , E Left < 
Right Wl 

Mieft. Right 7 Lf Mrena + Misi, Riga + Cleft -1 CiCRight | 
这 个 方程 意味 着 ,如 果 我 们 有 乘法 Anni Arg BIRARE HUF, ATR A 
A. 和 及 ,1…A 和 ri 就 不 能 次 最 优 地 据 行 。 这 是 很 清楚 的 , 因为 否则 我 们 可 以 通过 用 最 优 的 计 
算 代替 次 最 优 计算 而 改进 整个 结果 。 

这 个 公式 可 以 直接 翻译 成 递归 程序 , 不 过 , 正如 我 们 在 最 后 一 节 和 着 到 的 , 这 样 的 程序 将 
是 明显 低 效 的 、 然 而 , 由 于 大 约 只 有 Mur ra N22 个 值 需要 计算 , 因此 显然 可 以 用 一 个 
卡 米 存放 这 些 值 。 进一步 的 考查 表明 ,如果 Right — Left =k. 那么 只 有 在 Mio Re 的 计算 
中 所 需要 的 那些 值 M， ,满足 y ~ x < b. 这 告诉 我 们 计算 这 个 表 所 需要 使 用 的 顺序 : 

如 果 除 最 后 答案 MI v 外 我 们 还 息 划 显示 实际 的 乘法 顺序 ,那么 我 们 可 以 使 用 第 9 章 中 
最 短路 符 算 法 的 思路 . 无 沦 何 时 改变 Mer ,pm ， 我 们 都 要 记录 的 值 , 这 个 值 是 重要 的 、 出 
此 得 到 图 10-46 所 示 的 简单 程序 。 

虽然 本 章 重点 不 是 编程 , 但 是 , 我 们 还 是 要 说 , AERA Ri TIRE See EN, 
一 个 字母 这 并 没有 什么 好 处 。 可 是 这 里 c, i 和 大 却 是 作为 单字 和 母 变 量 使 用 的 ,这 是 因为 它 
f 与 我 们 描述 等 法 所 使 用 的 名 字 是 一 致 的 , 是 非常 数学 化 的 。 不 过 , RRR TH LTE 
Xx. 因为 “1" 非常 像 “1”( 阿 拉 伯 数字 }, 如 果 你 犯 了 一 个 转换 错误 . 那么 可 能 会 陷 人 
非常 困难 的 调试 麻烦 让。 

回 到 算法 问题 上 来 。 这 个 程序 包含 三 重典 套 循环 , 容易 看 出 它 以 ONHE. 参考 
文献 描述 了 一 个 更 快 的 算法 , 但 由 于 执行 具体 息 阵 乘法 的 时 间 仍 然 很 可 能 会 比 计算 最 优 顺 厅 
的 乘法 的 时 间 多 得 和 多, 因此 这 个 算法 还 是 相当 实用 的 。 

10.3.3 最 优 二 叉 查 找 树 

第 一 个 动态 规划 的 例子 考虑 下 列 输 入 : 给 定 一 列 单词 wy, we, cns ses 和 它们 出 现 的 男 
HY BEAR pi, pos es po 问题 是 要 以 一 种 方法 在 一 棵 二 叉 查 找 树 中 安放 这 些 单词 使 得 总 的 
期 组 存 取 时 间 最 小 。 在 - - 棵 二 叉 查 找 树 中 , 访 间 深度 d 处 的 一 个 元 素 所 需要 的 比较 次 数 是 
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d^. 因此 如 果 u, 被 放 在 深度 d, 上 ,那么 我 们 就 要 将 NICO p + d) BM. 
| 


/* Compute optimal ordering of matrix multiplication */ 

/* C contains number of columns for each of the N matrices */ 
/* C[ 0 ] is the number of rows in matrix 1 */ 

/* Minimum number of multiplications is left in M[ 1 J[ N ) */ 
/* Actual ordering is computed via */ 

/* another procedure using LastChange */ 

/* M and LastChange are indexed starting at 1, instead of 0 */ 
/* Note: Entries below main diagonals of M and LastChange */ 
/* are meaningless and uninitialized */ 


vaid 
OptMatrix( const long CE J, int M, 
TwoDimArray M, TwoDimArray LastChange } 
i 
int i, k, Left, Right; 
long ThisM; 


for( Left = 1; Left <= N; Left++ ) 
M[ Left ][ Left ] = 0: 
fort k= 1; k < N; k++ 3} f* k 3s Right - Left */ 
for( Left = 1; Left «<= N - k; Left++ ) 
1 
/* For each position 7/ 
Right = Left + k; 
ML Left }[ Right ] = Infinity; 
forl i = Left; i < Right; i++ J 
i 


- 一 — a — 1 c _»_ OE. -一 一 
一 一 一 一 一 一 一 一 一 一 一 _ 一 


ThisM = Mf Left JLi ] + MZ i + 1 J[ Right ] 
+ CL Left - 1] * CL i] * CE Right 1; 
if( ThisM < MT Left ]({ Right | ) 
| 
/* Update min */ 
MC Left I[ Right ] = ThisM; 
LastChange[ Left ][ Right ] = 7; 


| 
| 
) 
| B 
图 10-46 ” 找 出 矩阵 莱 法 最 优 顺序 的 程 厅 
作为 一 个 例子 , 图 10-47 表示 在 柴 段 课文 中 的 士 个 单调 以 及 它 
irj mates. 图 10-48 显示 三 标 可 能 的 二 义 查 找 树 。 它们 的 查找 
代价 如 图 10-49 FR. 
第 一 棵 树 是 使 用 仿 束 方法 培 成 的 。 存 取 概 率 最 高 的 单词 被 放 在 
根 节点 处 。 然后 左 丰 子 树 递 归 形 成 。 第 二 标 树 是 理想 平衡 查找 树 。 002 
这 两 棍 椅 都 不 是 最 优 的 ， 由 第 三 棵 树 的 存在 可 以 证 实 。 我 们 由 此 看 Lo | o% jJ 
到 明显 的 解法 都 是 行 不 通 的 ， mio 骂人 二 又 本 
乍 看 有 此 奇怪 ,因为 问题 看 起 来 很 像 是 构造 Huffman WER, 。 峙 问题 的 样本 输 人 人 
下 如 我 们 已 经 看 到 的 , 它 能 够 用 贪 禁 算法 求解 ， 构造 一 标 最 优 二 又 
在 找 树 更 困难 , 因为 数据 不 只 限于 出 现在 树叶 上 ， 树 还 必须 满足 二 又 查找 树 的 和 件 奈 。 
动态 规划 解 由 两 个 观察 结论 得 到 。 下 次 假设 我 们 想 要 把 ( 排 疗 的) 一些 单间 Wet, 
Wet tie o Right -l> Wight BE] ER RFE IT BREA LARAMLL w, ‘EAR. H 
中 Left Si Right, 此 时 左 子 树 必 须 包 含 wps cO wie 而 右 子 树 必须 包 合 w+. Us 
usm( 根 据 二 叉 查找 树 的 性 质 )。 再 有 , 这 两 梨子 笃 还 必须 是 最 优 的 ， 因为 否则 它们 可 以 用 最 
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C PRN. 这 将 给 出 基于 wry ts gu ECT ERES te, RTS ACE SUE REIS 
开销 Crus, gus Ba — PK. 图 10-50 可 能 足 有 帮助 的 ， 








—— —— M v 


| MBA RE a Bi 43 | 
| 单词 概率 Vio er Vi al P6 8r Viu fer | 
B, Py 
a Git 


Once Sequence Once Sequence Onee Sequence 











2 0.44 3 (1.66 2 (had 

am 0.18 4 0.72 2 0.36 0.54 

and 0.20 3 0.60 3 0.60 0.20 

eB 0.05 4 0.20 1 0.05 3 0.15 l 
T 0.25 I 1.25 3 0.75 2 0.50 

the 0.02 3 0.06 2 0,04 4 0.08 | 
two 0.08 i16 3 . } . 





图 10-50 Rit RAR AD aie 


hn Left > Right, 那么 树 的 开销 是 0; 这 就 是 NULL 情形 , 对 于 二 义 查 找 树 我 们 总 有 这 
种 情形 , 否则, BIER po 左 子 树 的 代价 相对 于 它 的 根 为 Cry. ,-1， 右 子 树 相 对 于 它 的 根 的 
代价 为 C-i Riche 如 图 10-50 Bras. 这 两 棵 树 的 每 个 节点 从 w; 开始 都 比 从 它们 对 应 的 根 开 


PRE, 因此, 我 们 必须 加 Sp, ADA 记 。 于 是 得 到 如 下 公式 


. | a 7^ 十 1 
» 4,7 min of Be t+ Chet T Coa, Ra + oP 2u Py! 
C. Righi lef Enun Rut | Pi Lerta: : ia 47 Lo? / geet] 
Riu i 
. Vet ` L 
= min (Chg ,-1 t Ciri, Right + ` P 
Left rt: Right y= Left 


从 这 个 方程 可 以 直接 编写 一 个 程序 来 计算 最 优 二 叉 但 找 树 的 价值 。 像 通常 一 样 ， 具体 二 
查找 树 可 以 通过 存储 使 Coop rigis 晤 小 化 的 i EMRE FE. 标准 的 递归 例 程 可 以 用 来 显示 具 
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WEBS AY 
图 10-51 显示 将 由 算法 产 牛 的 表 , MPa PR, 最 优 二 义 查 找 树 的 价 但 和 根 
都 被 保留 - 最 底部 的 项 计算 输入 的 全 部 单词 集合 的 最 优 一 义 查找 树 . 最 优 树 是 图 10-48 中 及 





Left=1 Lefl=2 Left=3 Lett=4 Left-5 Left=é Left=7 
iat i the..the | twp. two 
OR | two 





















and | .05 | EE 
gEi | 





BAR =2 

eR = 

BAAR =4 

ges am the | and twa 
7 [GB and [Ton 

am.. ， 

s ate] 

AR Sami 

A= - 


图 10-51 对 于 样本 输入 的 最 优 二 浆 查 找 树 的 计算 


对 于 一 个 特定 的 子 区 域 即 am. if 的 最 优 一 叉 查 找 树 的 精 人 确 的 计算 如 图 10-52 H. Ee 
汗 答 通过 在 根 处 放置 am, and, egg 利 计 所 得 的 最 小 ( 价 ) 值 树 而 得 到 的 - 例如 、 当 and RATE 
HARDIE, 左 子 树 包含 am. .am( 通 过 前 面 的 计算 , 值 为 0.18), 右 子 树 包 售 eee. iL CR 
W 0.35), TH Pant paa * Pegg + p= 0-68, 总 价值 为 1.21。 
[389 





0 0,80 + (0.68 = 148 DIS 40.35 4 O88 = 1.2] 
(ces) if 
aN van 
0.456 + 0.25 + 0.68 = 1.49 (L66 + 04 0.68 = 1.34 


图 10-52 Rt am. ,让 的 表 项 (1.21，and) 的 计算 


六 个 算法 的 运行 时 间 是 O(N3), 因为 当 它 实 现时 , 我们 得 惠 一 个 三 重 循环 对 十 这 个 问 
w .种 DCN2) 算 法 在 一 些 练习 中 进行 了 概述 . 
10.3.4 所 有 点 对 最 短路 径 | 

我 们 的 第 三 个 也 是 最 后 一 个 动态 规划 应 用 是 计算 有 向 图 G = CV... 巨 ) 中 每 一 点 对 问 赋 权 
最 短路 径 的 一 个 算法 。 在 第 9 章 我 们 看 到 单 发 点 最 短路 径 问 题 的 一 个 算法 ， 该 算法 找 出 从 任 
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意 一 点 s 到 所 有 其 他 项 点 的 最 短路 径 - 这 个 算法 (Dijkstra) 对 秽 密 的 图 以 OC! YI?) 时 间 运 行 ， 
但 是 实际 上 对 稀 朴 的 图 更 快 。 我 们 将 给 出 一 个 短小 的 算法 解决 对 稠密 图 的 所 有 点 对 的 问题 - 
这 个 算法 的 运行 时 间 为 OC VIA), TE EEXI Dijkstra 3E V. 次 夺 代 的 一 种 新 进 改进 但 对 非 
芝 福 密 的 图 可 能 更 快 ， 原 因 是 它 的 插 环 更 紧 泰 . MRE LANAI A A, HRA 
这 个 算法 也 能 正确 运行 ;而 Dijkstra 算法 此 时 是 失败 的 。 

让 我 们 回忆 Dijkstra 算法 的 一 些 重 要 细节 (读者 可 以 复习 9.3 08). Dijkstra 算法 在 顶点 并 
始 并 分 阶段 工作 ., 图 中 的 每 个 兢 点 最 终 部 要 被 选 作 中 和 间 顶 点 ， 如 果 当 前 所 选 的 项 反 是 v, 那么 
MTA wEV, Bd.=min(d,. d.c... 这 个 公式 是 说 ,从 s) 到 w 的 最 舍 距 离 或 者 是 
前 面 知 道 的 从 s 到 w RBS, 或 者 是 从 ;( 最 优 地 ) 到 v 然后 和 直接 从 v Bw AR. 

Dijkstra 算法 提供 了 动态 规划 算法 的 想法 : 我 们 依 序 选 择 这 些 顶 点 。 我 们 将 Dy ,定义 
AM v, Blo, RBH, vo. cn. oy PEAR Re RR, RRR EX, Dos = 
ci,» BPA Co. y PERN c Æo. BER, BBX, Divi; AAPA, 2] o, 的 
最 短路 径 。 

如 图 10-53 Bras, 24 k DOMPE AWE Di. F 写 出 一 个 简单 公式 ,从 v F U A 
vi, te 77, v FEA PSR RAR ARATE v, 作为 中 间 人 项 点 的 最 短路 答 , 或 
者 是 由 两 条 路 径 u,v, 入 一 vw 合并 而 成 的 最 短路 径 ， 其 中 的 每 条 路 径 只 使 用 抽 丰 一 上 PT 
点 作为 中 间 顶 点 。 这 导致 下 面 的 公式 


— 


i /* Compute All-Shortest Paths */ 
/* AL ] contains the adjacency matrix */ 
/* with AL i 1[ i ] presumed to be zero */ 
/* U[ ] contains the values of the shortest path */ 
/* M is the number of vertices */ 
/* A negative cycle exists iff */ 
/* DE i JL i J is set to a negative values */ 
/* Actual path can be computed using Path[ ] */ 
/* All arrays are indexed starting at 0 */ 
/* NotAVertex is -1 */ 





void 
All Fairs TwoDimArray A, TwoDimArray D, 
TwoDimArray Path, int N ) 
i 
int i, j, k; 


/* Initialize D and Path */ 


/* l*/ for( i= 0; 3 < Ni i++ 2 
f[* 2*/ for( j= 0; j < N; je 2 

| 
ft 3a/ OF i WG] =AL i 1[ j 3: 
A arf Path[ i J j ] = NotAVertex; 

} 
f® 5*7 for( k = 0; k < N; k+ ĵ 

/* Consider each vertex as an intermediate */ 
/* G*/ farf d = Q; i «Ny i++ ] 
A Pe fort j 20; j « Ni j++ D 
f* B*/ iFCDE iG kJ] DE k 11 3 2 «DE 3 1([ 3 1 ? 

{ 
/* Update shortest path */ 

/* 9*/ DLiJLj31sbLi JLk J * DL k ME 3 J: 
/*10* / PathE i J( k 15 k; 


图 10-53 ”所 有 点 对 最 短路 径 


EZ) 
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9t Di = mini D, born D-i, a t D, Lpi 
MIRRE OC VI. BS A GE cs MER FAT, ARRE EKRE 
方法 降低 。 


因为 第 上 阶段 只 依赖 于 第 (一 1 阶段 , 所 以 看 来 只 有 两 个 | VY | x VERE. 然 
而 ,在 用 开始 或 结束 的 路 径 上 以 作为 中 间 顶 点 对 结果 没有 改进 , REET 
因此 只 有 一 个 矩阵 是 必须 的 , 因为 Doo = De. 和 De ,= 及， 这 意味 着 右边 
的 项 痢 不 改变 值 苹 都 不 需要 存 情 -. 这 个 观察 站 果 导 致 图 10-53 中 的 简单 程序 ， 为 与 C 的 约定 
-一致 ， 该 程序 将 顶点 从 0 开始 编号 ， 

在 一 个 完全 图 中 , 每 一 对 顶点 (在 两 个 方向 上 ) 都 是 连通 的 , 该 算法 几乎 肯定 要 比 Dijkstra 
算法 的 | VUE RR. 因为 这 里 的 循环 非常 紧凑 ,第 1 行 到 第 4 行 可 以 并 行 执行 , 第 6 行 到 
第 10 行 也 可 并 行 执 行 . 因此 , 这 个 算法 看 来 很 适合 并 行 计 算 。 

动态 规划 是 强大 的 算 靶 设计 技 与 ， 它 给 解 提 供 一 个 起 点 。 它 基本 上 是 首先 求解 一 些 更 简 
单 问题 的 分 治 算法 的 范例 ,重要 的 区 别人 条 于 这 些 更 简单 的 问题 不 是 原 问 题 的 明确 的 分 割 . 因 
为 子 问 题 反 复 被 求解 ， 所 以 重要 的 是 将 它们 的 解 记录 在 一 个 表 中 而 不 起 重新 计算 它们 。 ER 
些 情况 下 , 解 可 以 被 改进 (虽然 这 确实 不 总 是 明显 的 日 常常 是 困难 的 )， 而 在 另 -- 些 情况 下 ， 
动态 规划 方法 则 是 所 知道 的 最 好 的 处 理 卢 法 。 

在 菜 种 意义 上 上， 如 果 你 看 出 一 个 动态 规划 问题 ,那么 你 就 看 出 所 有 的 问题 。 动 人 态 规 划 岗 
多 的 例子 在 一 些 练习 和 和 参考 文献 中 可 以 找到 。 


10.4 随机 化 算法 


假设 你 是 一 位 教授 , 正在 布置 每 周 的 程序 设计 作业 。 你 想 确 保 学 生 在 完成 白 己 的 程 施 ， 
或 至 少 理解 他 们 提交 上 来 的 程序 。 一 种 解决 方案 是 在 每 个 程序 呈 交 的 当天 进行 一 次 测验 ( 面 
武 )。 另 一 方面 ,这 些 测验 花费 课外 时 间 , 因此 实际 上 只 能 对 大 约 半数 的 程序 可 以 这 么 做 ., 你 
的 问题 是 决定 什么 时 候 进 行 这 些 测 验 

当然 . 如 果 事 先 宣布 这 些 测 验 , 那么 这 可 以 解释 为 对 得 不 到 测验 的 50% 程序 的 默许 作 
Wk. 你 可 能 采取 不 官 布 的 策略 对 备 选 的 程序 进行 测验 , 不 过 学 生 们 很 快 就 会 搞 清 楚 这 种 作 
ib. 另 一 种 可 能 是 对 看 似 重要 的 程序 进行 测验 ,而 这 又 会 进 露 从 学 期 到 学 期 类 似 的 测验 风 
格 . 学 生 传 播 部 考 些 什么 样 的 题 , 这 种 策略 很 吉 能 经 过 一 个 学 期 以 后 就 没有 什么 价值 了 - 


392, AE EO MC — 1967; HE EE (EHE — T BED, 测验 对 每 一 个 程序 进行 (举行 测 答 远 个 如 给 


他 们 评分 消耗 时 间 ), 在 开始 上 课时 教授 将 描 硬 币 来 决定 是 省 要 举行 测验 . 采用 这 种 方式 . 在 
上课 前 不 可 能 知道 测验 是 否 要 进行 ， 而 测验 的 模式 从 学 期 到 学 期 之 间 也 不 重复 - ux EE. ORT 
前 面 的 测验 都 是 什么 规律 , 学 生 只 能 预计 测验 发 年 的 概率 将 是 5096 © 这 种 方法 的 缺点 是 有 出 
能 整个 学 期 都 没有 测验 , 不 过 这 不 太 可 能 发 生 , 除非 硬币 有 问题 。 每 个 学 期 测验 的 期 望 次 数 
是 得 序数 日 的 一 半 ,， 并 旦 测验 的 寥 数 将 以 高 概率 不 会 太 偏离 这 个 数目 。 

这 个 例子 叙述 了 我 们 称 之 为 随机 化 算法 (randemized algorithm) 的 方法 。 FERGAL, B 
机 数 至 少 有 一 次 用 于 决策 。 该 算法 的 运行 时 间 不 只 依赖 于 特定 的 输入 ， MERTI EER 
Wa PLAN - 

— A- BL (CE 1: Be Up FT m TT 81 7L TR E AU SE RSA Ck BEE BU RH ES T RT e 
fj], mESÉBJECEMET , 好 的 随机 化 算法 没有 不 好 的 输入 ， 丽 只 有 坏 的 随机 数 ( 相 对 于 特定 的 输 
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AJ) 这 看 起 来 像 是 只 是 哲学 上 的 差别 , 但 是 实际 上 它 是 相当 和 草 要 的 , 正如 直面 的 例子 所 示 、 

兰 虑 快速 排序 的 防 种 变形 ., 方法 A 用 第 一 个 抑 素 作为 枢纽 元， 出 方法 了 使 用 随机 选 出 的 
元 素 作 为 枢纽 元 : 在 这 阿 种 情形 下 , 最 坏 情 形 运行 时 间 部 是 9(N*), 因为 在 每 一 步 都 有 可 能 
ARRAN CRE ADA. 两 种 她 坏 情 形 之 间 的 区 别 在 于 , 存在 特定 的 输入 总 能 吉 出 现在 
A 中 并 产生 不 好 的 运行 时 间 。 当 每 一 次 给 定 已 排序 数据 时 ,方法 A 者 将 以 BCN ) 时 间 运 行 ， 
如 果 方 法 B 以 相同 的 输入 运行 两 深 , 那么 它 将 有 两 个 不 同 的 运行 时 间 , 这 依赖 于 什么 样 的 随 
UL. 

(es £r RIS LEE RIER LEES Bi A Ap ee Pe. 实际 上 这 并 不 成 六 ,例如 
儿 乎 排序 的 输 人 常常 要 比 统计 上 期 望 的 出 现 得 多 得 多 ,而 这 会 产 竺 一些 问 题 , 特别 是 对 快速 
排序 和 二 叉 查 找 树 。 通 过 使 用 随机 化 算法 ,特定 的 输入 不 再 是 重要 的 。 重 时 的 是 随机 数 ， 我 
们 可 以 得 到 - :个 期 望 的 运行 时 间 ， 此 时 我 们 是 对 所 有 可 能 的 随机 数 取 平 均 而 不 是 对 所 有 可 能 
的 输入 求 平均 ,使 用 随机 枢纽 元 的 快速 排序 算法 是 一 个 O(N log NN) 期 望 时 间 算 法 ,这 号 是 
说 , 对 任意 的 输入 , 包括 已 经 排序 的 输入 , 根据 随机 数 统计 学 理论 , 运行 时 间 的 期 望 但 为 
OCN log N)。 期望 运行 时 间 界 多 少 要 强 于 平均 时 间 界 , 但 是 ,当然 要 比 对 应 的 最 坏 情形 前 
弱 ,， 另 -方面 ,正如 我 们 在 选择 问题 中 所 看 到 的 , 得 到 最 坏 情 形 时 间 界 的 那些 解决 方案 共 常 
不 加 | 已 们 的 平均 情形 那样 在 实际 中 常见 。 但 是 , 随机 化 算法 却 通 常 是 一 致 的 . 

在 这 一 节 , 我 们 将 考查 随机 化 的 两 个 用 途 ,, 首先 , 我 们 将 介绍 以 O(log N ;期望 时 间 支 持 
二 丸 在 找 树 操作 的 新 颖 的 方案 。 这 意味 首 不 存在 坏 的 输入 ， 只 有 坏 的 随机 数 。 从 理论 的 观点 
看 . 这 并 没有 那么 令 入 振 查 ,因为 平衡 但 找 树 侍 最 坏 情 形 下 达到 了 这 个 界 。 然而 , 随机 化 的 
使 用 导致 了 对 查找 、 插入、 特别 是 删除 的 相对 简单 的 算法 。 

第 “个 应 用 是 测试 大 数 是 和 否 是 素数 的 随机 化 算法 。 对 于 这 个 问题 , 没有 已 知 的 有 效 的 多 
mm s HEBES ILE E. 我 们 介绍 的 这 种 算法 运行 很 快 但 偶尔 会 有 错 。 不 过 , BER EHR 
的 概率 可 以 小 到 忽略 不 计 - 

10.4 1 ENBER 

d TGO EHE ELE. 因此 我 们 必须 要 有 一 种 廊 法 点 生成 它 。 实际 上 , 真正 的 随 
机 性 在 计算 机 上 是 不 可 能 的 , 因为 这 些 数 将 依赖 于 算法 ， 从 而 不 可 能 是 随机 的 。 一 般 说 来 ， 
y" np DISESUSE C pseudorandom number) 8 e 8E T, 多 随机 数 是 看 起 来 像 是 随机 的 数 。 随机 数 有 
许多 已 知 的 统计 件 质 ; 伪 随 宙 数 满足 这 些 性 质 的 大 部 分 。 令 人 惊奇 的 是 , 这 说 起 来 容易 , 做 起 
RUT RE E T- i 

设 我 们 只 需要 抛 一 枚 硬币 ， 这 样 , 我 们 必然 随机 地 生成 0 或 1。 一 种 做 法 是 考查 系统 时 
钟 、 这 个 时 钟 可 以 把 时 间 记 录 成 整数 , 而 这 个 整数 是 从 其 个 起 始 时 刻 开始 计数 的 秒 数 。 此 时 
我 们 可 以 使 用 它 的 最 低 二 进 制 位 。 问题 在 于 ,如果 希 要 随机 数 序列 , 那么 方法 就 不 理想 了。 

. 秒 是 .个 长 的 时 间 段 , 在 程序 运行 时 这 个 时 钟 可 能 根本 没 变化 。 即 使 时 间 用 微妙 为 单位 记 
4. 如 果 程序 自身 正在 运行 , 那么 所 生成 的 数 的 序列 也 远 不 是 随机 的 ， 内 为 在 对 发 生 器 的 多 
次 调用 之 间 的 时 间 在 每 次 程序 调用 时 可 能 都 是 一 样 的 。 此 时 我 们 看 到 , 真正 需要 的 是 随机 数 
M) AF 9) (sequence) ,站 这 些 数 应 该 独立 地 出 瑞 。 如 果 一 枚 硬币 抛 出 后 出 现 的 是 正 侧 ， HAR 
Dac HLH der | BAL rt a E Tr Ro GA LS] EHS - 


“在 梧 季 的 其 您 部 分 我 们 将 使 用 随机 代 蔡 伪 随 机 


E 


E 





PE RR E fe] RT PEI Re Ae, ETF 1951 年 由 Lehmer 首先 描述 . 数 

ro ea. vu RERE 
r,.Q7 Ar, mod M 

为 了 开始 这 个 序列 ,必须 给 出 xs 的 某 个 值 . AEn T (seed), WE ro=0, 那么 这 个 
序 刻 二 不 是 随机 的 , 但 是 如 果 A MM 选择 得 正确 , 那么 任何 其 他 的 Islay ME SH 
AeA), WE M 是 素数 , 那么 zx; 就 绝 不 会 是 0: 作为 一 个 例子 , 如果 MTM, A=7, fi xol, 
那么 所 生成 的 数 为 

7,5, 2,3, 10, 4,6,9,8, 1,7,5,2, “0” 

注意 , 在 M-1=10 个 数 以 后 , 序列 将 重复 . 因此 , 这 个 序列 的 周期 为 M 一 1, 它 是 仿 可 能 地 大 
(根据 住人 原理 )。 邵 果 M 是 素数 ,那么 总 存在 对 A 的 一 些 选择 能 够 给 出 整 周 期 (all period) M — 1, 
对 A 的 有 些 选 择 刚 得 不 到 这 样 的 周期 ;如 果 A —5 而 xo=1, BAR Pes. 

5.3,4,9,1, 5,3, 4, oo 

如 果 M 选择 得 很 大 ,比如 31 比特 的 素数 , 那么 对 于 大 部 分 的 应 用 来 说 周期 应 该 是 非常 
长 的 Lehmer 建议 使 用 31 个 比特 的 素数 M — 27! — 1 =2 147 483647, 对 于 这 个 素数 . A= 48 271 
是 给 出 整 周期 发 生 器 的 许多 值 中 的 -一 个 。 它 的 用 途 已 经 被 深入 研究 并 被 这 个 领域 的 专家 推 
B 后 面 我 们 将 看 到 ,对 于 随机 数 发 生 器 ， 贸 然 收 改 通 常 意味 善 失败 ,因此 我 们 替 劝 还 挟 纺 
续 坚 持 使 用 这 个 公式 直到 有 新 的 成 果 发 布 。 

这 像 是 一 个 实现 起 来 很 简单 的 例 程 。 一 般 地 , 全 局 变量 用 来 存放 x 的 序列 的 当前 值 : 这 
是 全 局 变量 发 挥 作用 的 罕见 情况 。 这 个 全 局 变量 由 某 个 癸 程 初始 化 。 当 调试 -- 个 使 用 随机 数 
的 程序 的 时 候 , 大 概 最 好 是 置 ru= 1, 这 使 得 总 是 出 现 相同 的 随机 序 州 。 当 程序 工作 时 ,可 以 
使 用 系统 时 钟 , 也 可 以 要 求 用 户 输入 一 个 值 作为 种 于 。 

返回 一 个 位 于 并 区 间 (0, 1) 的 随机 实数 (0 和 1 是 不 可 能 取 的 值 ) 也 是 党 见 的 情况 ;这 可 以 
通过 除 以 M 得 到 。 由 此 可 知 , 在 任意 闭 区 间 [a“ ，B] 的 随机 数 可 以 通过 规范 化 来 计算 。 这 将 广 
族 图 10-54 中 “明显 的 ” 例 程 , 不 过 , 该 例 程 只 在 很 少 的 桃 器 上 能 够 正常 运行 。 


static unsigned long Seed = 1; 


#define A 48271L 
#define M 2147483647. 


double 
Random( void ) 


Seed = ( A * Seed J & M; 
return ( double } Seed / M; 
t 


void 
Initialize( unsigned long InitVa! J 
{ 


Seed = Initval; 
} 





H 10-54 ”不 能 正常 工作 的 随机 数 发 生 疾 


这 个 例 程 的 问题 是 乘法 可 能 溢出 ;虽然 这 个 是 一 个 错 放 ， 但 是 它 影响 计算 的 结果 ， Ma 
影响 伪 随 机 性 ，Schrage 给 出 一 个 过 程 ， 在 这 个 过 程 中 所 有 的 计算 均 可 在 32 位 机 上 进行 而 不 会 
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溢出 ,我们 计算 M/A 的 商 和 余数 并 把 它们 分 别 定 多 为 Q@ 和 R, AECE F, Q= 44 488, 
R=3399, R Q. 我 们 有 








T= Ar, mod M = Ar; -M| = Ax, | 
onc gj B] SP 
ENERE 


H Fr, = alg | + x modQ, RITARA BMH Ar, 并 得 到 


rape a fQ Q5 la 1,modQ ]- | v a ML] ^i 
= (AQ - M)| 5 AMT. P 
但 M=AQ+R, Al AQ-M - - R. 于 是 我 们 得 刘 


zim = Alay mod Q) - R| Z |+ Mi aj- ls | 


maa= [Gii 


FRITH 








| 或 者 是 0, 或 者 是 1, MAPIA REKTEN. 因此 ， 


tia) = Ala; mod Q) 一 R| A + Mé(x,) 


局 速 验证 表明 , AARO, 故 所 有 的 余 项 均 可 计算 而 没有 浇 出 (这 就 是 选择 AA=48271 
的 原因 之 一 )。 此 外 , 仅 当 余 项 的 值 小 于 0 时 ,5(x;)=1。 因此 (x,) 不 需要 显 式 地 计算 而 是 
可 以 道 过 简单 的 测试 来 确定 。 这 导致 图 10-55 中 的 程序 。 


static unsigned long Seed = 1; 





i sdefine A 48271L 
edefine M 271474832647. 
#define Q (M / AJ 
xdefine R ( M X À 


double 
Randomi void } 
1 
long TmpSeed; 


TmpSeed = A * ( Seed X Q) - R * ( Seed / Q); 
if( TmpSeed >= à ) 

Seed = TmpSeed: 
else 

Seed = TmpSeed + M; 


return ( double } Seed / M; 


void 

Inirialize( unsigned long ImtVal ) 

1 
Seed = InitVal: 

I 


图 10-55 工作 十 32 PLEA RRL et 


ace 


395 


FAS INT _MAX222°!—1, 这 个 程序 就 能 正常 工作 - 大 们 可 能 会 息 到 要 假设 所 有 的 机 器 
在 它们 标准 库 中 都 有 一 个 至 少 像 图 10-55 中 的 程序 那么 好 的 随机 数 发 生 器 ,但 粳 粒 的 是 , 情 
(RA xe. EEH RAE HET RE 

r;247 (Ar, + C) mod 2? 
其 中 B 的 选取 要 匹配 机 器 整数 的 位 数 , 而 C 是 奇数 ,这 些 库 也 返回 x, ,和 而 不 是 0 和 1 之 问 的 
MA. 不 幸 的 是 , 这 些 发 生 器 总 是 产生 在 奇偶 之 间 交 错 的 zx, 的 年 一 一 很 难 具 有 至 想 的 性 
质 . 事实 上 ,《〈 充 其 三 ) 是 低 上 位 以 则 期 关 循环 。 许多 其 他 随机 数 发 生 器 雪 比 图 10-55 所 提供 
的 随机 数 发 生 器 的 循环 小 得 多 . 这 些 发 千 跨 对 于 需要 长 的 随机 数 序列 的 情 襄 足 不 合适 的 . xx 
后 , 我 们 通过 添加 一 个 常数 到 方程 中 去 可 能 会 得 到 更 好 的 随机 数 发 生 右 。 例 如 、 
xi = (48271x, +1) mod (21 - D 
多 少 会 更 加 随机 一 些 。 xx PET AKER A ERE AP IAS SIR o 
[48 271(179 424 105) +1] mod (2?! — 1) = 179 424 105 

因此 . WERF 179424105, 那么 发 生 器 将 陶 入 周期 为 1 的 循环 。 
10.4.2 PARR 

随机 化 的 第 一 个 用 途 是 以 O(log N) 期 望 时 间 支 持 查 找 和 插 人 的 数据 结构 .正如 在 本 下 介 





缚 中 所 提 到 的 , 这 意味 着 对 于 任意 输入 序列 的 每 一 次 操作 的 运行 时 间 剖 有 期 望 值 O Clog ND, 


其 中 的 期 望 是 基于 随机 数 发 生 器 的 。 能 够 洪 加 遇 除 和 所 有 涉及 排序 的 操作 并 得 到 与 一 叉 碍 找 
树 的 平均 时 间 界 匹配 的 期 望 时 间 界 。 

最 简单 的 支持 查找 的 可 能 的 数据 结构 是 链表 。 图 10-56 是 一 个 简单 的 链 小 . 执行 一 次 碍 
线 的 时 间 正 比 于 必须 考查 的 节点 个 数 , 这 个 个 数 最 多 是 N. 





图 10-56 简单 链表 


ki 10-57 表示 一 个 链表 , 在 该 链表 中 , SR D GT EP HG TET TREE TES PAI 
了 两 个 位 置 二 的 节点 。 正 因为 如 此 , 在 最 坏 情形 下 ,最 多 考 查 | N21+1 个 他 成 。 


el eet be eer 


图 10-57 HABEAS 2 个 表 元 素 的 指针 的 链表 


将 这 种 想法 扩展 ,我们 得 到 图 10- 58。 这 里 , 每 个 序数 是 4 的 倍数 的 节点 都 有 一 :个 措 针 指 
向 下 一 个 序数 是 4 的 信和 数 的 节点 。 只 有 [N41+2 个 节点 被 考查 。 





图 10-58 ” 带 有 指向 前 而 第 4 个 表 元 素 的 指针 的 链 直 


41 


这 种 跳跃 幅度 的 一 般 情 形 如 图 10-59 所 示 , 每 个 2: 节点 就 有 一 个 指针 指向 下 
点 .总 的 指针 个 数 仅 仅 是 加 倍 , 但 现在 在 一 次 查找 中 最 多 考查 | log N] 个 节点 。 不 难看 到 ， 
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次 查找 总 的 时 间 消 耗 为 Oflog N)， 这 是 因为 查找 由 癌 前 到 一 个 新 的 节点 或 者 在 同一 节点 下 
降 到 低 一 级 的 指针 组 成 。 在 一 次 查找 期 间 每 一 步 总 的 时 间 消 耗 最 多 为 Otlog NO. 注意 , 在 这 
种 茹 所 结构 中 的 个 找 基本 上 是 折 半 但 找 (binary search)» 





图 10-59 带 有 指向 前 面 第 2: Seon RIS Pr B 


这 种 数据 结构 的 问题 是 有 效 的 插入 太 过 于 有 呆板 。 使 用 这 种 数据 结构 的 关键 是 笑 敌 履 松 结 
KE ls 我 们 将 带 有 到 PRET AAT URGE MA Br PA level k node), WP 10-59 所 小 , 任意 e 
BS ER Cee R P+ 8 BBG i 阶 ; 这 是 一 个 容易 保留 的 性 质 ， 
不 过 , 图 10-59 指出 比 它 更 有 限制 性 的 性 质 . BOR, 我 们 把 第 ;个 指针 指 问 前 面 第 2 P5 eA 
的 这 个 限制 去 掉 , 而 代 之 以 上 面 稍 松 一 些 的 限制 条 件 。 

当 需 要 播 人 新 元 素 的 时 候 , 我 们 为 它 分配 一 个 新 的 节 态 ,此 时 ,我 们 必 顷 决定 寺 太 二 是 
多 少 阶 的 . 考查 图 10- 59 我 们 发 现 , 大约- : 半 的 节点 是 1 阶 节点 ， 大约 1/4 的 节点 是 2 阶 节 
点 , 一役 地 ,大 约 1/2: 的 节点 是 i 阶 节 点 。 我 们 按照 这 个 概率 分 布 随 机 选择 节点 的 阶 数 。 琉 
容易 的 方法 是 抛 一 校 硬币 直到 正面 出 现 并 把 抛 硬币 的 总 次 数 作 为 该 节点 的 阶 数 。 图 10-60 i 
AS — T BH AY EEA Ze (skip list). 





图 10-60 — ERA 


给 出 上 面 的 分 析 以 后 , 跳跃 表 算法 的 描述 就 简单 了 为 执行 一 次 Find, 我 们 在 头 节 点 从 
最 高 阶 的 指针 开始 , 沿 着 这 个 阶 一 直 走 ， 直 至 找到 大 于 我 们 正在 寻找 的 节点 的 下 一 个 下 所 
GR ER NULL) ATE FE. 这 个 时 候 , 我 们 转 到 低 一 阶 的 阶 并 继续 这 种 方法 - SET I EIER 
EH, 或 者 我 们 位 于 正在 寻找 的 节点 的 前 面 , 或 者 它 不 在 这 个 表 中 。 为 了 执行 一 次 Inen, 我 
人 | 像 在 执行 Find 时 那样 ,始终 监视 每 一 个 使 我 们 转 到 下 一 阶 的 节点 。 最后. A ES CELER 
阶 基 随机 确定 的 ) 拼 接 到 表 中 。 操作 见 图 10-61. 





图 10-61 di A BI RIMEÉLA IA BEEK e 
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粗 路 分 析 指 出 , HPA A CSE A) SP_TL 
HS RAAB TAO BY LER ERE. BARRA. RR fh 
O(log NJ, 当然, PUB SUE UEBER S ERU, 但 它 与 这 里 没有 太太 的 区 别 ， 

EK (Dp FRO, 它们 都 需要 估计 表 中 的 元 束 个 数 ( 从 而 阶 的 个 数 可 以 确定 )， 如 条 
得 不 刘 这 种 估计 , BAR oI VR T A ee FRETA RH rehash) 897r 3; a 
RRHH, 跳 颇 表 如 许多 平衡 查找 树 实现 方法 一 样 有 将, 当然, 用 许多 种 语言 实现 都 会 简单 
得 多 . 

10.4.3 索性 测试 

在 这 一 节 , 我 们 考查 确定 一 个 大 数 是 否 是 素数 的 问题 。 不 如 在 第 2 RRA, Xe 
窗 耕 方案 依赖 于 大 数 分 解 的 困难 竹 ， 比 如 将 一 个 200 位 数 分 解 成 两 个 100 EAR BE. 29 
[实现 这 种 方案 , 我 们 需要 一 种 生成 两 个 大 素数 的 方法 , 因为 现在 没有 人 知道 如 何以 d 的 多 
硕 式 时 间 测 试 一 个 a 位 数字 的 数 N 是 否 是 素数 , 所 以 分 钥 大 素数 的 问题 主要 还 是 理论 上 的 问 
M. 例如 ,测试 能 否 被 从 3 到 VN 的 奇数 整除 的 常用 方法 大 约 稍 要 方 V 玉 次 除法 , 它 大 约 为 
272. 另 一 方面 , 这 个 问题 不 被 认为 是 NP 完全 的 ;办 此 , 它 是 处 在 边缘 上 的 少数 区 个 问题 之 
它 的 复杂 性 在 编写 本 书 时 尚 不 灿 道 . 

在 这 一 章 , 我 们 将 给 出 一 个 可 以 测试 素性 的 多 项 式 时 间 算 法 。 如 果 这 个 算法 宣称 一 个 数 
AER, 那么 我 们 可 以 肯定 这 个 数 不 是 素数 。 如 果 该 算法 宣称 -个 数 是 素数 , 那么 , 这 个 
数 将 以 高 的 概率 而 不 是 100 另 肯定 是 素数 。 错误 的 概率 不 依 闵 于 被 测试 的 特定 的 数 , 而 是 依 
炳 于 出 算法 作出 的 随机 选择 . 因此 , 这 个 算法 偶尔 会 出 错 , 不 过 将 会 看 到 , 我 们 可 以 让 出 竺 
的 比率 任意 小 。 

等 法 的 关键 是 着 名 的 费 蕊 (Fermat) 定 理 ， 

定理 10.10 

UNE, 如 果 PP 是 素数 , LOK A<P, 那么 A” 1=1 (mod P). 

证 明 : 

这 个 定理 的 证 明 可 以 在 任 一 本 数论 教科 书 中 找到 。 

例如 ,由 于 67 是 素数 , 因此 29991 (mod 67)。 这 提出 了 测试 一 个 数 N 是 否 是 素数 的 算 
法 ,中 要 检验 一 下 是 再 2x-I 二 1 (mod N): BSE 271551 (md N) 不 成 立 ,那么 我 们 可 以 肯定 
w 不 还 素数 。 另 一 方面 , 如 果 等 式 成 立 , 那么 N 很 可 能 是 素数 。 例如 , 满足 六 ”一 1] (mod N) 
但 不 是 素数 的 最 小 的 N 是 只 =341- 

这 个 算法 偶尔 会 出 销 , 但 问题 是 它 总 出 一 些 相同 的 错误 。 换 名 话说 , 存在 N 的 一 个 国定 的 
集合 , 对 于 这 个 集合 该 方法 行 不 通 。 我们 可 以 尝试 将 该 算法 如 下 随机 化: 随机 取 I< A<N-L: 
aot AN =l (mod N), MAM N 可 能 是 素数 ,否则 宣布 N 肯定 不 是 素数 。 如 果 N= 341 rfi] 
A =3 那么 我 们 发 现 3 =56 (mod 341)。 因 此， 如 果 算 法 碰巧 选择 A = 3, WA ERX 
Y=34! 得 到 正确 的 答案 。 

虽然 这 看 起 来 没有 问题 , 但 是 却 存 在 一 些 数 , 对 于 A 的 某 些 选择 它们 甚至 可 以 映 过 该 算 
法 一 种 这 样 的 数 集 叫 做 Carmichael 数 ， 这 些 数 不 是 素数 ,可 是 对 所 有 与 N CRRIBIO AUN 
Hy AV '=1 (mod N); 最 小 的 这 样 的 数 是 561。 因 此 ， 我 们 还 需要 一 个 附加 的 测试 来 改 
PEAS BG FR ILS 
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在 第 7 了 章 , 我 们 证 明 过 一 个 基于 平方 探测 (quadratie probing) AYE B. 这 个 定理 的 特殊 情 
况 如 下 : 
定理 10.11 
如 果 P ERB O<X <P, HBA X21 (mod P) 仅 有 的 两 个 解 为 =1, P - 1. 400. 
证 明 : 
X=] (mod P) BRA X^ -1=0 (mod PO. HEU. (X - 1) (X+1)=0 (mod P). 
HTF PRR. OSX <P, WIE P SR ERR — D, 或 者 整除 (X+1), 由 此 推 
he FE. 
因此 ,如 果 在 计算 A" (mod NRE HT AUR AMIE Y Be, ABA SDN A 
不 是 素数 。 如 果 使 用 2.4.4 SORE, 那么 我 们 看 到 将 有 几 种 机 会 来 实 规 这 种 测试 ”我们 
修改 执行 对 N 的 求 余 运 算 的 例 程 并 庙 用 定理 10.11 的 测试 ,这 种 方法 在 图 10-62 rp SCRI. 


/* If Witness does not return 1, N is definitely */ 
/* composite. Da this by computing ( A ^ i ) mod N and */ 


/* looking for non-trivial square roots of 1 along the */ 
/* way. We are assuming very large numbers, so this */ 
/* is pseudocode */ 





HugeInt 
Wwitness( Hugelnt A, Hugelnt i, Hugelnt N ) 


{ 
Hugelnt X, Y; 


1f(T == 0) 


rerurn 1; 


X = Witness( A, 7 / 2, N}; 
if X == DY /* Lf MN is recursively composite, stop ui 
return 0; 


/* N is not prime if we find a non-trivial root of 1 "/ 
* {X * KM AN; 
if( Y -2 1 && X f= 1 && X Ie N - 1) 

return OD: 


if( i%2 t= 0) 
Y2(A* YOXN; 


return Y; 


} 


/* IsPrime; Test if N >= 3 is prime using one value = 
/* of A. Repeat this procedure as many times as needed */ 
/* for desired error rate */ 


int 
IsPrime( Hugeint N ) 
{ 
return Witness( RandInt( 2, M- 22, N- 1, N j) = 1; 
} 





图 10-62 ”一 -种 概率 素性 测试 算法 


我 们 知道 ,如果 函数 Witness 返回 任何 不 四 1 的 数 , 那么 它 就 已 经 证 明了 N WERK, 
其 证 明 是 非 构造 性 的 , 因为 它 并 没有 具体 给 出 找到 因子 的 方法 。 业已 证 明 . 对 于 任何 { 充分 大 
HN, 至 多 有 A 的 (N -9)/4 个 值 会 使 该 算法 得 出 错误 的 结论 。 因此 ， 如 果 A 是 随机 选取 
的 ,而 月 算法 的 结论 是 N (很 可 能 ) 为 素数 , 那么 至 少 有 7596 B5 0] LEE TE RE IE GR BO. T eR 
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Witness 运行 50 次 , 则 算法 得 出 错误 结论 的 概率 是 子 。 因 此 ,50 次 独立 的 随机 试验 使 算法 出 
的 概率 绝 不 会 超过 1/49 = 2 ， 实 际 上 这 是 非常 保守 的 估计 , 它 只 对 N 的 某 些 选择 成 
立 .即使 如 此 ,人们 更 可 能 看 到 的 是 硬件 的 错误 ,而 不 是 对 于 数 的 素性 的 不 正确 的 衫 布 结果 ， 


10.5 EAA 


我 们 将 要 考查 的 最 后 -- 个 算法 设计 技巧 是 回潮 (backtracking) 算 法 . FIPS, DH 
算法 相当 于 穷 举 搜 索 的 巧妙 实现 , 但 性 能 一 般 不 理想 。 不 过 . 情况 并 不 总 是 如 此 ， 即 使 如 此 ， 
在 某 些 情形 下 它 相 比 蛮 力 {brute force) 3 24518 98 , LRA BATA. 当然 , 性 能 是 由 对 
的 : 对 于 排序 而 言 ，D CN?) 的 算法 是 相当 差 的 , 但 对 旅行 售货员 (或 任何 NP 完全 ) 问 题 ， 
COON? ) 算 法 则 基 里 程 碑 式 结 冬 ， 

ql 潮 算 苇 的 一 个 具体 例子 是 在 一 套 新 房子 内 摆 放 家 有 具 的 问题 。 存 在 许多 可 能 的 尝试 , 但 
一 般 只 有 一 些 是 具体 要 考虑 的 。 开 始 什么 也 不 摆 放 , 然后 是 每 件 家 具 被 摆 旋 在 室内 的 茶 个 妆 
分 如 果 所 有 的 家 具 都 已 抒 好 而 旦 户主 很 满意 , 那么 算法 终止 - RBA SY, 该 步 之 后 
的 所 有 家 具 氛 放 方 法 都 不 理想 ,那么 我 们 必须 机 销 这 一 步 半 尝试 该 步 男 外 的 舞 放 方法 . U 
5k. 这 也 可 能 导致 另外 的 撤销 , 等 等 。 如 果 我 们 发 现 我 们 撤销 了 所 有 可 能 的 第 一 步 摆 放 位 置 ， 
那么 就 不 存在 满意 的 家 其 摊 放 方法 . 否则 , 我 们 最 终 将 终止 在 满意 的 摆 放 位 置 上 - 注意 . 中 
然 这 个 算法 基本 上 是 蛮 力 的 , 但 是 它 并 不 直接 尝试 所 有 的 可 能 . 例如 , E TEE TERCER ET 
的 各 种 摆 法 是 绝 不 会 尝试 的 。 许 多 其 他 坏 的 摆 放 方 法 嘻 就 取消 了 , 因为 令 人 讨厌 的 摆 放 的 子 
华 是 知道 的 . 在 一 步 内 删除 一 大 组 可 能 性 的 做 法 叫做 栽 前 (pruning)。 

我 们 将 看 到 回 湖 算法 的 两 个 例子 - 第 -个 是 计算 史 何 中 的 问题 ， 第 二 个 例子 毅 述 在 请 如 
[8 Ey. S FCRI DE E EC B9 EE n nn fap ERI UOCE BEZE DR D I] 8 
10.5.1 收费 公路 重建 问题 

END bp Prec bye 它们 位 于 x 轴 上 。 r, © p 点 的 x Bin. 进一步 假 区 
-二 0 以 及 这 些 点 从 左 到 右 给 出 。 这 N 个 点 确定 在 每 一 对 点 间 的 NCN 一 1 人 2 个 (不 必 丰 惟 : 
的 ) 形 如 | -ae GAER. 显然 如果 给 定点 集 , 那么 容易 以 OCNTODUE TRE FH EA E 
EO., 这 个 集合 将 不 是 排序 的 , 得 是, 如果 我 们 愿意 花 OC N?log N) 时 间 界 整理 , HB Z, ix Here 
离 也 可 以 被 排序 .收费 公路 重建 问题 {turnpike reconstruction problem) f& M cue ih Eg 38 39 TAL de 
一 个 点 集 。 它 在 物理 学 和 分 子 生物 学 (参见 为 更 专门 的 信息 提供 线索 的 参考 文献 ) 中 都 有 应 
用 ,这 个 名 称 得 自 于 对 美国 西海 岸 公路 上 那些 收 税 公路 出 口 的 模拟 。 正 像 天 数 分 解 比 乘 法 轴 
礁 一 样 , 重建 问题 也 比 建造 问题 困难 。 没 有 人 能 够 给 出 一 个 算法 以 保证 在 多 项 式 时 间 户 完成 
计算 我 们 将 要 介绍 的 算法 -- 般 以 DCN2log N) 运 行 , 但 在 最 坏 情 形 下 可 能 要 化 费 指 数 时 间 

当然 ， 苦 给 定 该 问题 的 一 个 解 , 则 可 以 通过 对 所 有 的 点 加 上 一 个 偏 移 量 而 构建 无 穷 多 其 
他 的 和解 .这 就 是 为 什么 我 们 一 定 要 将 第 … 个 点 置 于 0 处 以 及 构建 解 的 点 集 以 非 降 顺 片 条 出 的 
ARES. 

A D BA, 并 设 , DI = M- NUN -1 作为 例子 、 说 

D=11, 2, 2, 2, 3,3, 3, 4, 5, 5, 5, 6, 7, 8, 101 

4) | =15, 因此 我 们 知道 N 6. 算法 以 置 ?1 70 开始 。 显然 ，x6 一 10, AX 104 

D 中 最 大 的 元 素 。 将 10 从 D 中 删除 , RIISER SURE RE S SF Bs. 


PERI HR 2$ 305 


D-311,2,2,2,3,3,3,4, 5, 5, 5,6, 7, 8: 
d RESgERESHUECAB ES, 这 就 是 说 , EA r= 2, 要 人 么 rs=8。 几 对 称 忻 ,我 们 可 以 断 
定 这 种 选择 是 不 重要 的 ,因为 要 么 两 个 选择 都 引 何 解 (它们 互 为 镜像 ),， 要 人 么 都 不 会 引 癌 最 终 
的 解 ， 所 以 我 们 可 置 xs =8 而 不 至 于 影响 问题 的 解 : 然后 从 DPR BER ar, — rg = 2 Hl 
ts- 2, =8, 得 到 


ty = 0 X4 二 8 Xe = 10 
D211,2.2,3,3,3,4,5,5,5,6, 7° 
下 一 步 是 不 明显 的 . 由 于 了 是 了 中 最 大 的 数 , AES 4-77, BZ = 3, WE r457, 
那么 距离 reg-7=3 利 rs-7=1 也 必须 出 现在 DW. 我 们 一 看 便 知 它们 确实 在 DP. AR 
方面 ， 如 果 我 们 置 r53, 那么 3 一 +1=3 和 x 一 3=5 ROME DE, REE WME D 
rp. 办 此, 我 们 不 对 哪 种 选择 做 强求 。 这 样 , 我 们 尝试 其 中 的 一 种 看 是 省 它 导 至 问 题 的 解 如 
Be AG, 那么 我 们 退回 来 天 尝试 另外 的 那个 选择 。 尝试 第 一 个 选择 我 们 外 x4 =7, fel 


x, = 0 X4 = 7x; = 8 xa = 10 
D=:2, 2,3.3, 4,5,5,5, 61 


此 时 , 我 们 得 到 zj =0, 4-7, r57 8 T r4 7 10. 现在 最 大 的 距离 是 6. 因此 要 么 r356, 
BA 2574, 但 是 , 如 果 r356, 那么 za- rid. 这 是 不 可 能 的 ， 因为 1 不 再 属于 D.5-- 
Ai, 如果 7.274, BA ro- eg a4 A rs- 02 = 4, 这 也 是 木 可 能 的 , 因为 4 Re DHEN 
一 次 。 因此 , 这 个 推导 思路 得 不 到 解 ,我 们 需要 回潮 。 

由 于 r,=7 不 能 产生 解 , 因此 我 们 尝试 x; =3。 如 果 这 也 不 行 , BARMERA 
告 无 解 . ME, 我 们 有 


x, = 9 xx = 3 xs = 8 x, = 10 
D=}1, 2,2, 3, 3.4, 5, 5. 6! 
我 们 必须 再 一 次 在 2g = 6 和 zs=4 之 问 选 择 。rs=4 是 不 可 能 的 , AAD 只 出 现 一 个 4， 
面 该 选择 意味 着 要 有 两 个 。x4 =6 是 可 能 的 , 于 是 我 们 得 到 


———————————— 


x, = 0 xy = 3 x4 = 6 x, = 8 x, = 10 
H= 11, 2. 3, 5. 5i 
性 一 剩 下 的 选择 是 r;= 5, 这 是 可 以 的 , 因为 它 使 得 DD 成 为 空 集 ,因此 我 们 得 到 问题 的 一 个 解 。 





图 10-63 是 一 棵 决策 树 , 代表 为 得 刘 解 而 采取 的 行动 。 这 里 , RERA X A IEEE. 
而 是 把 标记 放 序 了 分 支 的 目的 节点 上 。 带 有 一 个 是 号 的 节点 表 不 这 些 所 选 的 上 53 26 E VOD EI 
不 - : 敏 ; 带 有 两 个 星 号 的 节点 只 有 将 不 可 能 的 节点 作为 儿子 节点 , 因此 表示 一 条 不 正确 的 
路 径 ， 





图 10-63 收费 公路 重建 问题 的 决策 树 


空 现 这 个 算法 的 伤 代码 大 部 分 部 很 简单 。 驱动 例 程 Turnpike 如 图 10-64 所 示 . CREM 
AER X( 不 需要 初始 化 ), 距离 的 数组 D 和 NN. 呈 如 昌 找 到 一 个 解 ， 则 返回 true, BHR 
al XX 中 ,而 也 将 是 空 集 。 mH, 返回 fle, X MERGE BU. 距离 数组 将 是 木 触及 的 。 该 例 
程 旭 上 所 述 给 r ryf zw ET., 修改 了 了, 并 且 调 用 了 回潮 算法 Place 以 放置 其 余 的 
点 。 我 们 假设 为 保证 | Di = N(N -1)/2 已 经 进行 检验 。 










int 
Turnpike( int X[ J, DistSet D, int N ) 
1 


= 1*/ X[ 1] = 0; 
/* ij XE N ] = DeleteMax{ D >; 
f* 37 XE. N - 1] = DeleteMax( D }; 
fe A&P if XEN] - XEN -1L]€ D} 
i 
f® Dw Remover XL N ] - XP N- 1], D); 
/* Bi return Placet X, D, N, 2, N- 2 3; 
1 
else 
fe Fes return False: 


(E 10-64 WARE HE; 驱动 例 程 ( 伪 代 码 ) 





， 为 使 所 举 的 例子 方便 起 岂 , 我 们 使 用 了 音 宁 尽 变 量 各， 一 般 说 来 这 不 是 好 习惯 ,为 了 简单 . Pelih AAH EEA 
类 型 。 
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更 国难 的 部 分 是 回 测算 法 ， 如 图 10-65 所 示 , 5i X CIR REM FE. 最 方便 的 实现 方 
法 是 递归 . 我 们 传递 同样 的 参数 以 及 界 Left PM Right zip. AR 是 我 们 试图 放置 的 点 的 
r 坐标 。 如 果 是 空 集 (或 Left > Right), 那么 解 已 经 找到 ,我 们 可 以 返回 ,。 否则, 我 们 首先 党 
斌 使 zs 三 只 。 如 果 所 有 适当 的 距离 都 (以 正确 的 值 ) 出 现 , 那么 尝试 性 地 放 上 这 一 点 , 删除 
RER, 并 尝试 从 Left 到 Right —1 SAL. 如 果 这 些 距离 不 出 现 , 或 者 从 Left 到 Right — 1 HA 
入 尝试 失败 ,那么 我 们 尝试 置 cup = xw dn 使 用 类 似 的 方法 。 如 果 这 样 不 行 . 则 问题 无 
解 ; 否 则 , 一 个 解 已 经 找到 , 而 这 个 信息 最 终 通 过 return 语句 和 X 数组 传递 回 Turnpike. 





/* Backtracking algorithm to place the points */ 
/* X[ Left ... Right ] */ 

/* XL 1... Left - 1] and XE Right + 1 ... N ] */ 
/* are already tentatively placed */ 

/* If Place returns True, */ 

/* then X[ Left ... Right J will have values */ 


int 
Place( int X[ ], BistSet D, int N, int Left, int Right ) 


int DMax, Found - False; 


/* 1*/ if€ D is empty ) 
/* 2*/ return True; 
/* ài*/ DMax = FindMax( D 2; 


/* Check if setting X[ Right ] = DMax 7s feasible */ 
/* 4*/ if(| XE j ] - Dax | € D 
for all 1 = j < Left and Right « j =N) 
{ 


J* 5*7 XI Right j = DMax; /* Try XE Right j = DMax */ 

/* 67/ for( 1 = j < Left, Right <j = ND 

fn Fe Deletet | XE j ] - DMax |, D X: 

/* oY ift !Found ) /* Backtrack */ | 
/*10*/ for( 1 = j « Left, Right < 了 


= HJ /* Undo deletion */ 
/*1l*/ Insert( | X[ j ] - DMax |, D 3; 
li 


/* If first attempt failed, try to see if setting rd 
/* X[ Left ] = XL N ] - DMax is feasible */ 


l 
y* B*/ Found = Place( X, D, N, Left, Right - 1 }; 


f[*12*/ if( !Found && ( | XL NJ - DMax - XL 351! & G 

f/*13*/ for all1 = j « Left and Right « j = W ) ) 
{ 

/*14*/ X[ Left ] = X[ N 1 - DMax; /* Same logic as before */ 

/*15*/ for( 1 = j < Left, Right « j = NJ 

f*16*/ Delete | X[ N J - OMax - X[ 3 1 |. 0 3; 

/*l7*/ Found = Place( X, D, N, Left + 1, Right 2; 


f*18*/ if( !Found ) /* Backtrack */ 
/*19*/ for( 1 = j < Left, Right < j = 
/*20*/ Insert( | XL N ] - DMax - XI j 


} 
/*21*/ return Found; 





图 10-65 收费 公路 重建 算法 ; 回潮 的 步骤 ( 伪 代 码 ) 


算法 的 分 析 涉及 两 个 因素 。 设 第 9 行 到 第 11 行 以 及 第 18 行 到 第 20 FARAT. RIE 
以 把 D 作为 平衡 二 叉 查 找 (或 伸展 ) 树 保存 (当然 ， 这 需要 对 代码 做 些 收 改 )。 如 果 我 们 从 未 回 
Me AKA EA ON METER D, 如 在 第 4 行 . 第 1 到 13 行 中 蕴 售 的 删除 和 Find. t 
然 这 是 对 删除 提出 的 , 因为 D 有 O(N?) 个 元 素 而 没有 元 素 被 重新 搞 人 。 每 次 对 Place 的 调用 


A — = 
— 一 
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最 多 用 到 2N 次 Find, 而 由 于 Place 在 该 分 析 中 从 未 问 滴 ,因此 最 多 可 以 有 2N” 次 Find. 于 
A. 如果 设 有 回潮, 那么 运行 时 间 为 ON og N)。 

HA, HAERE. WEIMER, 那么 算法 的 性 能 就 到 受到 影响 .我们 可 以 
通过 构建 病态 的 情形 人 迫使 它 发 生 . 经 验证 明 , 如 果 点 的 整数 坐标 在 0，PD, |] 均匀 地 和 随机 地 
分 布 ， 其 中 D, = O(N), 那么 在 整个 算法 期 间 几 平 肯 定 最 多 执行 - -次 所 潮 。 

10.5.2 (ax 

作为 最 后 一 个 应 用 , 6l TRES BET BL RTT ES, PE ak D Er S B8 
作为 一 个 例子 ,， Bel PR FAT GERIT) — EEA Clic tac-toe RAR, AE RA AE AG. 

则 果 双 方 痢 玩 到 最 优 , 那么 三 连 游 戏 棋 就 是 平局 。 通 过 进行 任 细 的 逐个 情况 的 分 机 , 构 
造 -个 从 不 输 棋 而 且 当 机 会 出 现时 总 能 访 棋 的 算法 并 不是 困难 的 事 - 这 所 以 能 够 做 到 是 因为 
一 些 倍 置 是 已 知 的 陷阱 , 可 以 通过 查 表 来 处 理 - 另外 一 些 方法 , 如 当中 央 的 方 格 可 用 时 占据 
该 方 格 , 可 以 使 得 分 析 更 简单 。 如 果 完 成 了 分 析 , 那么 通过 使 用 一 个 表 我 们 总 十 以 只 根据 当 
前 位 置 选 择 一 步 供 . 当然 , 这 种 方法 需要 程序 员 而 不 是 计算 机 来 进行 大 部 分 的 思考 ， 

极 小 极 大 策略 

ip 一 般 的 策略 是 使 用 -- 个 赋值 函数 来 给 一 个 位 置 的 “好 坏 ” 定 值 . 能 使 计算 机 获胜 的 位 
gt af PE ESL + 1; 平 局 可 得 到 0; 使 计算 机 输 祺 的 位 置 得 到 值 - 1。 通过 考察 盘 而 能 够 硼 定 这 
局 棋 输 赢 的 位 置 叫 司 终 端 位 置 (terminal position) 。 

如 果 一 个 位 置 不 是 终端 位 置 , 那么 该 位 置 的 值 通过 递 时 地 根 设 双方 最 优 棋 步 而 确定 。 这 
山谷 极 小 极 大 (minimax) 策 略 ， AA TER - 方 ( 人 ) 试 图 使 这 个 位 置 的 值 极 小 化 ， 而 号 A 
(计算 机 ) 却 要 使 它 的 值 极 大 ， 

(E P BE BEI X (successor position) EAGLA P 走 一 步 棋 可 以 达到 的 任何 位 置 P， 如 
果 妆 在 某 个 位 置 P 计算 机 要 走 棋 , 那么 它 递归 地 求 出 所 有 的 后 继 位 置 的 值 。 计算 机 选择 具有 
最 大 值 的 -步行 棋 , 这 就 是 了 的 值 ; ATSB Re P. THE. 要 递归 地 算出 已 的 所 
有 后 继 位 置 的 值 ， 然 后 选取 其 中 最 小 的 值 . 这 个 最 小 值 代 表 行 横 人 一 方 最 赞成 的 应 描 。 

图 10-66 中 的 程序 使 得 计算 机 的 策略 更 清楚 , 第 1 行 到 第 4 行 直接 给 赢 棋 或 平局 赋值 . 
如 果 这 两 个 情况 都 不 适用 , 那么 这 个 位 置 就 是 非 终 端 位 置 。 注意 到 Value 应 该 包括 所 有 可 能 
后 继 位 置 的 最 大 值 , 第 5 行 把 它 初始 化 为 最 小 的 可 能 值 , 第 6 行 到 第 13 行 的 循 坏 则 为 了 改进 
而 进行 搜索 。 每 一 个 后 继 位 置 递 归 地 依次 由 第 8 到 第 10 行 算 出 值 来 。 因为 我 们 将 看 到 过 程 
FindHumanMove 调用 FindCompMeve, 所 以 这 是 递归 的 。 如 果 下 横 人 对 一 步 棋 的 应 招 给 计算 
机 留 下 比 计算 机 在 前 面 最 佳 棋 步 所 得 到 的 位 置 更 好 的 位 置 , 那么 Value 和 BestMove 将 被 内 
Er. 图 10-67 BARMERA RRS HE. 除了 下 棋 人 选择 的 棋 步 导致 最 低 值 的 位 置 
外 ,所 有 的 有 逻辑 实际 上 部 是 相同 的 . 事实 上 ， 遂 过 传递 一 个 额外 的 变量 不 难 把 这 两 个 过 程 分 
并 成 一 个 , 这 个 额外 变量 指出 该 谁 走 棋 。 这 样 一 来 确实 使 得 程序 多 少 有 些 难于 读 民 了, TA 
我 们 就 停留 在 两 个 分 开 的 例 程 的 阶段 。 

下 于 这 上 防 个 例 程 必须 要 传 回 位 置 的 值 和 最 住 的 棋 步 ， 因此 我 们 通过 使 用 指针 米 传递 将 得 
到 这 些 信 息 的 两 个 变量 的 地 址 。 现在 ， 最 后 的 两 个 参数 现在 回答 的 就 不 是 “是 什么 ” 而 是 “在 
HB" T. 

作为 一 个 例子 , 在 图 10-66 中 BestMove 包 会 可 以 放置 最 佳 棋 步 的 地 址 。FindCompMove 
通过 访问 x BestMove 可 以 考查 或 修改 这 个 地 址 中 的 数据 。 第 9 行 指出 主 调 例 程 应 该 怎样 运 
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f. BET FARE THE A AH BUE, 而 FindHumanMove HE xt SRA HOHE , 
因此 这 里 用 到 了 地 址 操作 符 & ~ 










/* Recursive procedure to Find best move for computer */ 
/* SestMove points to a number from 1 to 9 indicating square */ 











/* Possible evaluations satisfy CompLoss < Draw < Compwin */ 
/* Complementary procedure FindHumanMove jis Figure 10.67 */ 
/* Board is an array and thus can he changed by Placa */ 


void 
FindCompMove( BoardType Board, int *BestMove, int “Value ) 
{ 


int Dc, 7, Response; /* Dc means don't care */ 


/* l*/ ift FullBoard( @oard ) 3 
f* 2*/ "Value - Draw; 
else 
/* 3*/ ifi ImmediateCompwin( Board, BestMove ) ) 
/* 4*/ *Value = Compwin; 
else 
{ 
/* 5*/ *Value = Compioss; 






for(i = 1; i <= 9; i++ ) /* Try each square */ 







if( IsEmpty( Board, i ) ) 
{ 






Place( Board, i, Comp 3; 
f* 9*/ FindHumanMavetc Board, &Dc, &Response 3; 
Unplace( Board, i 3; /* Restore Board */ 






if( Response > *Value ) 






/* Updare best move */ 
/*1à*/ *Value = Response; 
/*13*/ *BestMove = i; 








图 10-66 极 小 极 大 三 连 游 戏 模 算法 : 计算 机 的 选择 


如 果 在 第 9 行 不 用 操作 符 &. 并 且 Dc 和 Response 均 为 零 ( 这 是 典型 的 未 初始 化 数据 ), AB 
4 FindHumanMove 将 试图 把 最 佳 模 步 和 位 置 值 放 到 内 存 位 置 零 处 . 当然 ,这 不 是 我 们 想 归 的 ， 
并 将 几乎 肯定 导致 程序 崩溃 ( 试 一 试 !)。 这 是 在 使 用 库 函 数 中 的 scanf 族 函 数 时 最 常见 的 错误 。 

我 们 把 -一些 支持 例 程 留 作 一 道 练习 题 。 代 价 最 高 的 计算 是 需要 计算 机 开局 的 情形 。 由 于 在 
这 个 阶段 棋局 处 于 平局 的 形势 , 因此 计算 机 选择 方 格 1.2 需 要 考查 的 位 置 总 共有 97 162 个 ， 计 
算 要 花费 几 秒 ,。 没有 优化 程序 的 打算 。 如 时 下 横 人 选择 中 央 方 格 , 那么 当 计 算 机 走 第 二 步 嵌 的 
ate, 所 要 考查 的 位 置 的 个 数 是 5185 个 ,当下 棋 人 选 样 一 个 角 上 的 方 格 时 , 计算 机 所 要 考查 则 
位 置 是 9761 个, 而 当下 棋 人 选择 非 角 的 边 上 的 方 格 时 计算 机 要 考查 13 233 个 位 置 。 

对 于 更 复杂 的 游戏 , 如 西洋 跳棋 和 国际 象棋 , 搜索 到 终端 节点 的 全 部 棋 步 显然 是 不 可 行 
的 ,在 这 种 情况 下 , 我 们 在 达到 递归 的 某 个 深度 之 后 只 能 停止 搜索 。 递归 停止 处 的 节点 则 成 

5 我 们 将 方 格 从 棋盘 左上 角 开 始 向 古 编号, 不 过 , 这 只 对 支持 例 程 是 重要 的 。 
= Akt. BUM FREER, 那么 对 于 第 - 步 棋 至 少 有 10Im 个 位 置 需要 考查 。 即使 是 本 节 稍 后 描述 的 改 


V 


进 方法 结合 使 用 , 这 个 数字 志 不 能 妖 低 到 实用 的 水 平 。 
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A4 E13 o XX oS TS ex BO E AE RAKAA E. 例如 , Ae E 
IFF, OR (BL ER GR IE ADUPECTTORIL EUR ASR EE a, OR OT FR 
是 至 关 重 要 的 ， 因 为 计算 机 的 行 棋 选 步 是 基于 将 这 个 函数 极 大 化 。 基 好 的 计算 机 下 棋 程 厚 的 
AR FR OR Bet A AY 28 












void 
FindHumanMove( BoardType Board, int *BestMove, int “Value ) 
{ 

int Dc, i, Response; /^ De means don't care */ 


} 


fe 1*7 Fi FullBoard( Board 3 3} 
| f= 2*/ “Value = Draw; 
| else 
A 3*/ ift ImmediateHumanwin( Board, BestMove ) ) 
| ft qe? *Value = CompLoss; 
else 
| 1 
/* ary "Value = Compwin; 
| y* Gr for( i = 1; ) «= 9; i++ ) /* Try each square */ 
i 
| fe Y*f ift IsEmpty( Board, i ) 3 
i 
/* B*/ Place( Board, 1, Human 3; 
/* 8*7 FindCampMove( Board, &0c, &Response 5; 
/*10*/ Unplace( Board, i 3; /* Restore board */ 
/*11*/ iff Response < *Value ) 
了 
/* Update best move */ 
/*12*/ *Value = Response: 
/*13*/ *BestMove = 1; 





10-67 HR-MEASFEDRRELER: 人 的 选择 


然而 , 对 于 计算 机 下 棋 , 一 个 最 重要 的 因素 看 米 是 程序 能 够 向 前 看 的 棋 步 的 数目 。 有 时 
我 们 称 之 为 层 (ply); 它 等 于 递 妇 的 深度 。 为 了 实现 这 个 功能 , 需要 给 予 搜索 例 程 一 个 额外 的 

在 对 弈 程序 中 增加 向 前 看 步 因 素 的 基本 方法 是 提出 一 些 方法 , 这些 方法 对 更 少 的 节点 求 
HEATERS., RIE 经 看 钊 的 一 种 方法 是 使 用 一 个 表 来 记录 所 有 已 经 被 计算 过 值 
的 位 置 。 例 如 , 在 搜索 第 一 步 棋 的 过 程 小 , 程序 将 考查 图 10-68 中 的 一 些 位 置 。 如 果 这 些 位 
VHS I. 一 全 位 置 在 第 二 次 出 现时 就 不 必 再 重新 计算 ; 它 基本 上 变 成 了 一 个 终 
端 位 置 。 记 录 这 些 信息 的 数据 结构 叫做 置换 表 (transposition table) ; 它 儿 乎 总 可 通过 散 列 来 实 
现在 许多 情况 下 , 这 可 以 节省 大 量 的 计算 例如 , 在 一 盘 棋 的 最 后 阶段 ， 此 时 相对 来 说 只 有 
很 少 的 棋子 , 时 间 的 节省 使 得 一 步 搜索 可 以 进行 到 更 深 的 者 下 层 。 
a-p 裁剪 

人 省 ] 一 般 能 够 取得 的 最 重要 的 改进 称 为 aB AY (aB pruning}. 图 10-69 hizk4E— 3E 

查 的 棋局 中 用 来 给 某 些 某 个 假设 的 位 置 求 值 的 一 些 递归 调用 的 迹 。 iF 38 ix 0] BR SE nr 
(game tree)。( 到 现在 为 正 我 们 一 直 回避 使 用 这 个 术语 ， 因为 它 和 多 少 有 些 令 人 误解 : A AL 
由 该 算法 具体 构造 的 , 博弈 树 只 是 一 个 抽象 的 概念。 ) 这 棵 博弈 树 的 值 为 44。 
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图 10-70 BRR MR, CAE ARAN ILE AE SR TIS 
没有 被 检验 。 我 们 证 明 计 算 它们 的 值 将 不 改变 树 很 的 值 。 





图 10-70 “一 棵 被 裁减 的 搏弈 树 


首先 , 考虑 节点 万。 图 10-71 显示 在 给 D 求 值 时 已 经 搜集 到 的 信息 。 此 时 , 我 们 仍然 处 
£t FindHumanMove 中 并 正在 打算 对 D 38H FindCompMove. 然而 , 我 们 已 经 知道 FindHu- 
manMove 最 多 将 返回 40, 因为 它 是 一 个 min 节点 。 男 一 方面 , ER max d uS ap 
证 一 个 保证 44 的 顺序 。 注意 ， D 无 论 如 何 也 不 可 能 增加 这 个 值 。 因 此 ，P 不 需要 求 值 。 该 树 
的 这 个 裁减 叫做 裁减。 同样 的 情况 出 现在 节 Bo 为 了 实现 0 裁减 . FindCompMove HE 
尝试 性 的 极 大 值 (fo 传递 给 FindHumanMove. 如 果 FindHumanMove 的 党 试 性 的 概 小 值 低 于 
这 个 值 , 那么 FindHumanMove 立即 返回 。 


| 32 | # 10% 





10-71 标记 “* 委 的 节点 是 不 重 邓 的 


ait 类 似 的 情况 也 发 生 在 节点 A AIC xR, 我们 在 FindCompMove 的 中 间 ， # HF 98] 
un 用 FindHumanMove 以 计算 C 的 值 . 图 10-72 显示 在 节点 CC 过 到 的 这 种 情况 。 人 不过, HAAS 
Bl FindCompMove 的 FindHumanMove TE min JEE, 已 经 确定 它 能 够 迫使 一 个 值 最 高 到 44( 注 
音 , 对 于 下 模 人 这 一 方 低 的 值 是 好 的 )。 由 于 FindCompMove 有 一 个 尝试 性 的 最 太 值 68. 因此 
C min 层 上 怎么 做 也 不 会 影响 到 这 个 结果 。 因 此 ，C 不 应 该 求 值 - 这 种 类 型 的 裁减 叫做 8 

裁减 ; 它 是 a 裁减 的 对 称 形 式 。 当 两 种 方法 结合 起 来 时 我 们 得 到 a-p Ro 





图 10-72 标记 “9?” 的 节点 是 示 重 要 的 


实现 o-p 裁 碱 所 需 代码 少 得 惊人 - 图 10-73 显示 的 是 a-B 裁减 方案 的 一 半 { 减 去 类 型 说 
明 )。 你 应 该 能 够 写 出 另 一 半 代 码 而 不 会 遇 到 任何 麻烦 。 

为 了 充分 利用 vB 裁减 , 对 弈 程序 通常 尽量 对 非 终端 节点 应 用 求 值 画 数 , 力图 把 最 好 的 
祺 步 早 一 些 放 到 搜索 范围 内 。 这样 的 结果 甚至 比 人 们 从 随机 顺序 的 节点 所 期 望 的 裁减 还 要 裁 
减 得 多 。 其 他 一 些 方法 , 像 以 积极 的 方式 进行 更 深入 的 搜索 也 在 使 用 。 

在 实践 中 ,a8 裁 碱 把 搜索 限制 在 只 有 OC N) 个 节点 上 , 这 里 N 是 整个 博弈 树 的 大 小 。 
六 足 巨大 的 节约 , 它 意味 着 使 用 aB 裁 威 的 搜索 与 非 裁减 树 相 比 能 够 进行 到 两 倍 的 深度 我 
们 的 兰 连 游戏 横 例 子 是 不 理想 的 ， 因 为 存在 太 多 相同 的 值 ， 但 即使 是 这 样 ， 最 初 对 97 162 个 
节点 的 搜索 还 是 被 碱 到 了 4 493 个 节点 (这 些 计 数 包括 非 终端 节 上 总 )。 

在 许多 对 弈 领域 , 计算 机 跻身 于 世界 最 优秀 弈 者 之 列 。 所 使 用 的 方法 是 非常 有 趣 的 ,而 
月 可 以 应 用 到 一 些 更 严肃 的 问题 上 。 更 多 的 细节 可 见 参 考 文献 。 
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/* Same as before, but perform alpha-beta pruning */ 
/* The main routine should make the call with */ 
/* Alpha = CompLoss and Beta = Compwin */ 


| void 
FindCompMovet BoardType Board, int *BestMove, int *value, 
int Alpha, int Beta } 


int Dc, i, Response; /" Dc means don't care */ 


/* l*/ ift FullBoard( Board ) ) 
f* vy "Value = Draw; 
else 
fv yy if{ ImmediarteCompwin( Board, BestMove 3} 3 
f* 4*/ *Value = Compwin; 
else 
i 
/? gy Value = Alpha: 


/* for( 1 = 1; 1 «2 9 && *Value « Beta; i++ ) 





{ 
fe Pf if( IsEmpty( Board, 1 } ) 
i 
/* B" Place( Board, i, Comp 2: 
/? g*/ FindHumanMovet Board, &Dc, &Response, 
‘Value, Beta »: 
/*l0*/ Unplace( Board, i 2; /* Restore board */ 


Pa ift Response > “Value ) 





/* Update best move */ 
fr12*/ "Value = Response; 
/*13*/ *BesrMove = 1; 








10-73 E o PRR IR AS ERE: 计算 机 棋 步 的 选择 


ole 

x — EGET EA PRAM ERK. STR, EA 
间 考 察 一 下 这 些 方法 能 否 适 用 是 值得 的 。 算 法 的 适当 选择 , 结合 数据 结构 的 审慎 使 用 , 常常 
能 够 迅速 导致 问题 的 高 效 解决 。 


练习 
10.1 WE AERE A Zi eae LER FERN R ME 
10.2 WEE 让, jo o UN 为 输入 ， 其 中 的 每 一 个 作业 都 要 花 一 个 时 间 单 位 来 完成 。 如 
果 每 个 作业 ; 在 时 间 限 度 ， 内 完成 , 那么 将 挣 得 d; 美元 , 但 若 在 时 间 限 度 以 后 抑 
p NT AS 8 X 
a. 给 出 一 个 OCNT ) HEEB ROR Ae l 
。 ,修改 你 的 算法 以 得 到 O(N log N) 的 时 间 界 。 提示 : 时 间 界 完全 归 因 于 将 作业 
按照 金额 排序 。 算 法 的 其 余部 分 可 以 使 用 不 相交 集 数 据 结构 以 CN log N) 
3:9. 
10.3 OAA F Fi dear m. 空格、 换行 (newline)、 刘 号 和 数字 ; 冒号 (100)， 
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#108 


10.23 
10.24 


* *h. 


ZGOS), HRTTCIOUD, 1247 ( 705), 01431), 1(242), 20176), 3059), 4(185), 5 
(250), 6(174), 7(199), 8(205), 9(217)。 构 造 其 Huffman Set 

编码 文件 有 一 部 分 必须 是 指示 Huffman WARF. E816 AERA 
EH OUN) 的 文件 头 ( 除 符号 外 ) ,其 中 是 符号 的 个 数 。 

证 明 Huffman 编码 生成 最 优 的 前 缀 码 。 

证 明 : 如 果 符 号 是 按照 频率 排序 的 , 那么 Huffman 算法 可 以 以 线性 时 间 实 更 

用 Hoffman 算法 写 出 -个 程序 实现 文件 庄 缩 4 和 解压 缩 )。 


证 明 : 通过 考虑 下 述 项 的 序列 可 以 迫使 任意 联机 装 箱 算法 至 少 使 用 最 优 箱子 数 : 


N 项 大 小 为 二 一 2e ，N 项 大 小 为 上 +e，N 项 大 小 为 了 + 
解释 如 何以 时 间 OCN log N) 实 现 首次 适合 算法 和 最 佳 适合 算法 ， 
指出 在 10.1.3 节 讨 论 的 所 有 装 箱 方法 对 输入 0.42, 0.25, 0.27,0.07, 0.72, 
0.86, 0.09, 0.44, 0.50, 0.68, 0.73, 0.31, 0.78, 0.17, 0.79, 0.37, 0.73, 
0.23, 0.30 的 操作 。 
编写 一 个 程序 比较 各 种 装 箱 试探 方法 (在 时 间 上 和 所 用 箱子 的 数量 上 ) 的 性 能 。 
证 明定 理 10.7. 
证 明定 理 10.8. 
将 N 个 点 放大 一 个 单位 方 格 中 。 证 明 最 近 一 对 点 之 间 的 距离 为 ON 12). 
论证 对 于 最 近 点 算法 , 在 带 内 的 平均 点 数 是 OC ND. 提示 : 利用 前 -- 道 练 避 的 结 
果 。 
编写 一 个 程序 实现 最 近 点 对 算法 . 
使 用 一 分 化 中 项 的 中 项 方法 , 快速 选择 算法 的 渐 近 运行 时 间 是 多 少 ? 
证 明 七 分 化 中 项 的 中 项 的 快速 选择 算法 是 线性 的 。 为 什么 让 明 中 不 用 七 分 化 中 项 
的 中 项 方法 ” 
实现 第 7 章 中 的 快速 选择 算法 , 快速 选择 使 用 五 分 化 中 项 的 中 项 方法 , 并 实现 
10.2.3 节 来 尾 的 抽样 算法 .比较 它们 的 运行 时 间 。 
许多 用 于 计算 五 分 化 中 项 的 中 项 的 信息 都 被 丢弃 了 。 指出 怎样 通过 更 仔细 地 使 用 
这 些 信息 减少 比较 的 次 数 。 
完成 在 10.2.3 节 末 尾 描 述 的 抽样 算法 的 分 析 , 并 解释 8 和 s 的 值 如 何 选择 - 
指出 如 何 用 递归 乘 算法 计算 XY, 其 中 X=1234，Y = 4321。 要 包括 所 有 的 递归 
计算 。 
指出 如 何 只 使 用 三 次 乘法 将 两 个 复数 X —a tbi HY cc di SEX. 
a. 证 明 

X Yg + XRY, = (Xi t Xg) (YL+ Yr) —XLYL- XrRYR 
b. 它 给 出 进行 N- 比 特 的 数 的 乘法 的 O(N1”) 算 法 。 将 该 方法 与 课文 中 的 解法 进 
行 比较 。 
_ 指出 如 何 通过 求解 大 约 为 原 问题 三 分 之 一 大 小 的 互 个 问题 来 完成 喇 个 数 的 区 
ik. 
将 该 问题 推广 得 出 -- 个 OUCNL ERE, HOR >0 为 任意 参数 。 
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10.30 
10.31 


* 10.33 


10.34 
10.35 
10.36 
10.37 
10.38 


10.39 


c. 在 5 问 中 的 算法 比 OCN log NM? 
为 什么 Strassen 算法 在 2x2 5B E BOSE HE (AY SE PESE AY. 
两 个 70 x 70 第 阵 可 以 使 用 143 640 1X3 PE SE. TH d ix An ef Be E HS TF pco d 
Strassen 算法 给 出 的 界 。 
计算 A,A+A;A,45A, 的 最 优 方法 是 作 - 么 ? 其 中 ,这些 矩阵 的 阶 数 为 41: 10% 20, 
As: 20X 1, Aa: 1X40, Ag: 40X5, Ag: 5X30, Ag: 30x 15, 
uEHH P FERIA ARETE RK. 在 每 一 步 
a. HARD BHR. 
b. iT SOR ER REB ES 
c. 计算 两 个 矩阵 M; 38M; ,1 之 同 的 乘法 使 得 在 M, 中 的 列 数 最 小 (使 用 上 和 而 法 则 
之 一 )。 
编写 一 个 程序 计算 此 隆 乘法 的 最 佳 硕 序 。 注意 , 程序 要 显示 具体 的 顺序 。 
指出 下 列 单 洱 的 最 优 二 及 查找 树 , 其 中 插 号 内 是 单词 出 现 的 频率 ; (0.18), and 
(0.19), 10.23), (0.21), or(0.19). 
ie Lo MARES BID WIA AIR RET. 在 这 种 情况 下 ,由 EA 
EEE vo, << Ww 1 的 单词 W 执行 - -次 查找 的 概率 ， 其 中 1 委 j< No go 是 对 
W« w, 的 单词 W 执行 一 次 查找 的 概率 ,而 qu EAW > ww 执行 一 次 查找 的 概 
iC ;=0, 否则 
C, ,= W,,* min (C, +- 1+ €) 
ik W 满足 四 边 形 不 等 式 (qusdrangle inequality}, 即 对 所 有 的 ;过 Spey, 
Wt Wy, Wy, + Wu 
进一步 假设 WA: Ri RS. MBA OW, Wi. 
a. 证 明 C 满足 四 边 形 不 等 式 。 
b. S R. REC, 1+ Ce, ,达到 最 小 值 的 最 大 的 & (就 是 说 , 在 由 等 的 情形 下 选择 
BAN &)- 证 明 : 
R&R; Jt RR, 541 
c. 证明 R BETTER. 
d. 用 它 证 明 C 中 所 有 的 项 可 以 以 O(N TIE 
e. 使 用 这 些 技巧 可 以 以 O(N?) 解 决 哪个 动态 规划 算法 ? 
编写 一 个 例 程 从 10.3.4 节 中 的 算法 重新 构造 那些 最 短路 径 。 
在 你 的 计算 机 系统 上 考查 随机 数 发 生 器 。 其 随机 人 性 如 何 ? 
编写 在 跳 耻 表 中 执行 插入 、 删 除 以 及 查找 的 例 程 。 
给 出 跳 牙 表 操 作 的 期 望 时 间 为 O(log N) 的 正式 让 明 。 
图 10-74 显示 抛 一 枚 弄 币 的 例 程 ,假设 rand 返回 一 个 整数 (这 在 许 冤 系统 中 党 
见 )。 如果 随机 数 发 生 器 使 用 形 如 M=2 的 模 ( 址 憾 的 是 这 在 许多 系统 上 流行 )， 
3E 2, SEES BIEBK e BEDAE UST EPI PE E ALES ? 
a. FREE SEERA 270951 (mod 341). 
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10.40 
10.41 


10.42 
10.43 


$10 


enum CoinSide { Heads, Tails }; 
typedef enum CoinSide CoinSide; 


Coinside 
FIip( void 3 
{ 


iff ( rand( ) X 2 3j 5 0) 
return Heads; 

else 
return Tails: 





图 10-74 有 问题 的 抛 币 青 (程序 ) 


b. 指出 随机 化 素性 测试 对 于 N = 561 并 伴 有 A 的 多 个 选 拌 是 如 何 工作 的 . 
实现 收费 公路 重建 算法 。 

如 果 两 信 点 集 产 生 相 同 的 距离 溪 合 而 不 彼此 转换 ， 那 么 这 两 个 点 集 称 为 是 同 度 的 
(homometricy。 下列 昨 离 集合 给 出 两 个 不 同 的 点 集 : 11, 2, 3. 4. 5, 6, 7, 8. 9, 
10, 11, 12, 13, 16, 17). 求 出 这 两 个 点 集 。 

扩展 重建 算法 使 给 定 一 个 距离 集合 找 出 所 有 的 同 度 扩 集 。 

指出 图 10-75 中 的 树 的 aG 裁减 的 结 采 。 





10.44 

10.45 

10.46 

- * 10.47 
u 
l 
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图 10-75 “搏弈 树 , DEBERI ARIA 


a. PA 10-73 中 的 程序 实现 a 裁减 还 是 了 裁减? 

b. SMH HR S ILE 

写 出 tic-tac-toe 棋 剩 下 的 过 程 。 

— # X i 19] 38 (one-dimensional circle packing problem) 4H F : AN 个 半径 分 别 是 
ry roy te ry 的 加 ,将 这 些 贺 装 到 一 个 盒子 中 ， 使 得 每 个 圆 都 与 盒子 的 底 边 相 
切 , 圆 的 排列 按 康 来 的 顺序 。 该 问题 是 找 出 最 小 尺寸 的 盒子 的 宽度 。 图 10-76 最 示 
个 例子 ， 圆 的 半径 分 别 为 2, 1, 2。 最 小 尺寸 盒子 的 宽度 为 4+ 4/2. 

设 无 向 图 G 的 边 满足 三 角形 不 等 式 : cr t co um Cu. wo 指出 恕 何 计算 价 伍 最 多 
为 最 优 路 径 两 售 的 旅行 售货员 游程 。 提示 : 构造 最 小 生成 树 。 

假设 你 是 邀请 赛 的 经 举 , 需要 安排 N=2 个 运动 员 间 一 轮 罗 宾 茹 请 赛 (robin tour- 
narment)， 在 这 次 邀请 赛 上 ， 每 人 每 天 恰好 打 一 场 比 赛 ;N 一 1 天 后 ， A xd EF qn] E 
已 进行 了 比赛 。 给 出 一 个 递归 算法 安排 比赛 。 


BPE RIF 37 





图 t0.76 ” 装 贺 问题 实例 


10.49 +a. 证 明 在 一 轮 罗 宾 六 请 赛 中 总 能 够 以 顺序 p. ob, pi 安排 运动 员 使 得 对 耳 
BAIS N, p AAEM p, 的 比赛 。 
b. 给 出 一 个 O(N log N) 算 法 来 找 出 这 样 的 安排 。 你 的 算法 可 以 作为 上 ela) 
的 证 明 。 
«10.50 HEFELE N 个 点 的 集合 P= pi. pasos pne 个 Voronoi 图 是 将 平面 分 成 N 
MARR 的 一 个 划分 , 使 得 R, 中 所 有 的 点 都 比 P 中 任何 其 他 的 点 都 里 接近 po 
图 10-77 显示 十 个 {细心 安排 的 ) 点 的 Voronoi 图 。 给 出 一 个 O(N log NN) 算法 构造 
Voronoi 图 。 





910-77 Voronoi 图 


+10.51 A Bit (convex polygon) 是 具有 如 下 性 质 的 多 边 形 : 端点 位 于 多 边 形 .上 的 任意 线 
段 全 部 藩 在 该 多 边 形 中 。 廿 包 (convex huil) 问 题 是 找 出 一 个 将 平面 上 的 点 集 财 往 的 
(面积 ) 最 小 的 凸 多 边 形 。 图 10-78 显示 和 0 个 点 的 点 集 的 凸 包 。 给 出 找 出 吓 包 的 一 
TON log NAE. 





图 10-78 -个 凸 包 的 例子 
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A EE BR VASE PE a. EIR AIRERA ayaa. ay IPR i] 
wy, to, 7, wy 组 成 , 我 们 希望 把 它 破 成 长 度 为 上 的 一 些 行 : Hills E E ATE 
陋 , 空白 的 理想 长 度 是 EK), 但 是 空白 在 必要 的 时 候 可 以 伸 长 或 收缩 (不 过 必 
MAF O0), 使 得 一 行 wey pow, 的 长 度 恰 好 是 工 , SA, UPR AR b RT] 
要 装填 i6 — b| > FLA (ugliness point). 不 过 , 最 后 一 行 是 例外 ,我 们 上 在 b xb 
的 时 候 装 填 { 换 句 话 说, 装填 只 在 收缩 的 时 候 进行 ), 因为 最 后 一 行 不 需要 调整 . 这 
BÉ. WR 6, 是 在 a; 和 e+ 之 问 的 空白 的 长 度 , 那么 尾 何 一行 (最 后 一 行 除外 ) 
way ye, G> AILR BB S07 1 & bl = Gi) lbh), dob oe 
该 行 上 空白 的 平均 大 小 。 这 只 在 六 过 声 时 对 最 后 一 行 适 用 , el, 最 后 - 行 根本 不 
a. 给 出 一 个 动态 规划 算法 来 找 出 将 wey, we. oy ws 排 成 长 度 为 上 的 TT AN 
小 的 丑 点 设置 。 提示 : 对 于 7? 二 N,N 一 1,…, 1, 计算 w wp cc, w 的 最 
好 的 排版 方式 。 
b. 给 出 你 的 算法 的 时 间 和 空间 复杂 度 ( 作 为 单词 个 数 N B eR BED | 
c. 考虑 我 们 使 用 行 式 打印 机 而 不 是 激光 打印 机 的 特殊 情况 , 假设 5 的 最 优 值 为 1 
(EREMO. 在 这 种 情况 下 , 不 允许 空白 收 舌 ,因为 下 一 个 最 小 的 宰 白 空间 走 0, 给 
出 一 个 线性 时 间 算 法 在 -一 台 行 式 打印 机 于 生成 最 小 的 丑 点 设置 。 
最 长 递增 子 序列 (longest increasing subsequence HAN F: 给 定数 ai ，a2，…，av， 
uis a, <a; € Xa, Hi irm 的 最 大 的 值 . 作为 -个 例子 ,如果 
输入 为 3, 1, 4,1, 5, 9, 2, 6, 5, 那么 最 大 递增 子 列 的 长 度 为 ACUTE PUN L, 4, 
5, 9)。 给 出 一 个 O(CN2) 算 法 求解 最 大 递增 子 序列 问题 。 
最 长 公共 子 序列 (longest common subsequence) 问题 如 下 : 给 定 两 个 序列 A= a), 
43,77, ay TB m bi, bo, oo, on, HRY A MB —dA dta ide EK F3 C- c. 02, 
… c BEER. 例如 , E 
A=d, y, Nn, a, M, i, C 
和 
B=p,r, 0. gsr, a, m, m. 1, n, g 
则 最 长 公共 子 列 为 a, m. 其 长 度 为 2, 给 出 -个 算法 求解 最 长 公共 于 列 问题 . 你 的 
算法 应 该 以 DO 〇 CUMN) 时 间 运 行 . 
字 型 匹配 问题 {pattern matching problem) 如下: 纵 定 一 个 文本 品 S Pp a, 
jxib P dp S 中 的 首次 出 现 。 近似 字 型 匹配 (approximate pattern matching) FAP 
1. 一 个 字符 在 S 中 但 不 在 P P. 
2, 一 个 字符 在 了 中 但 不 在 S H. 
3. PAIS 可 以 在 一 个 位 转 上 不 同 。 
的 到 次 误 匹 配 。 例 如 , AREP “data structures txtborpk” 中 搜索 “texthook ft 
许 最 多 一 次 旋 匹 配 ， 在 我 们 找到 一 个 匹配 ( 揪 人 一 个 e, 将 一 个 改变 成 co, 删除 一 个 
pj, 给 出 一 个 O(MN) 算 法 求解 近似 串 匹 配 问题 , 其 中 M= | PLAN = ISl. 
背包 问题 (knapsack problem) 的 一 种 形式 如 下 : 给 定 整数 集合 A = a1, azs c aN 
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* 10.57 


* 10.58 


* 10.59 


10.60 


WP BAK. 存在 A -AER K 子 集 吗 ? 
a. 给 出 -一 个 算法 人 以 时 间 O( NK RAET 
b. 为 什么 它 不 证 明 卫 = NP? 
给 你 一 个 货币 系统 , CHERIE ch. co. tt. ew 分 以 递减 顺序 排列 。 
a. 给 出 一 个 算法 计算 找 K 分 零钱 所 需 最 小 的 硬币 数 ， 
b. 给 出 一 个 算法 计算 找 及 分 零钱 的 不 同 的 方法 数 ， 
考虑 将 8 个 皇后 放 到 一 张 (8 行 8 列 的 ) 模 盘 上 的 问题 。 两 后 被 说 成 是 互相 对 攻 的 如 
果 她 们 处 在 则 一行, 或 同一 询 , 或 同一 条 (不 必 是 主 ) 对 角 线 上 。 
a. 给 出 一 个 随机 化 算法 把 8 个 非 攻击 皇后 放 到 棋盘 上 。 
b. 给 出 一 个 回潮 算法 解决 同一 个 问题 . 
o 实现 这 两 个 算法 并 比较 它们 网 运行 时 间 。 
在 国际 象 祺 中 , 在 RÍTC)EBEELFERSIEGESIISCR' «B £280 1C «B 列 ( 其 
中 BRAM ACD Ab, BRERA 
IR-~R'|=2R'C-C|=1 
BL 
IR-R'i-1Ri1C-CIz2 
马 的 一 次 环 游 是 马 在 棋盘 上 的 一 系列 跳 行 ， 它 俗 好 访问 所 有 的 方 格 一 次 最 后 驻 回 
到 开始 的 位 置 。 | 
a. 如 果 BEAR, 让 明 马 的 环 话 不 存在 。 
b. 给 出 一 个 回潮 算法 找 出 马 的 一 次 环 游 。 












Distance 
Shortest( 5, T, G ) 
1 


Distance dr. Tmp; 


ift ST) 
return 0; 

dy = =; . 
for each Vertex V adjacent ta 5 
| 

Tmp = Shortest( V, T, G ji 

ifC a + Tmp < Dr 
+ Imp; 
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return d; 


图 10-79 jmd) Ec P EAE 


考虑 图 10-79 中 的 递归 算法 , 该 算法 在 一 个 无 力图 中 寺 找 从 S 到 了 的 最 短 赋 权 路 
径 。 Í 

a. 这 个 算法 对 于 一 般 的 图 为 什么 行 不 通 ? 

b. 证 明 该 算法 对 无 图 图 能 够 终止 。 

c. 该 算法 的 最 坏 情形 运行 时 间 是 多 少 ? 
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第 11 章 RM oO H 


在 这 一 章 ,我 们 将 对 在 第 4 章 和 第 6 章 出 型 的 几 种 高 级 数据 结构 的 运行 时 间 进 行 分 析 , 特 
别 是 我 们 将 考虑 任意 顺序 的 M 次 操作 的 最 示 情形 运行 时 间 。 这 与 更 一 般 的 分 析 有 所 不 同 ， 
后 省 蜂 对 单 次 的 操作 给 出 最 坏 情 形 的 时 间 界 ， 

例 旭 ,我 们 已 经 看 到 AVL 树 以 每 次 操作 O(logN) 最 坏 情 形 时 间 支 持 标准 的 树 操作 . 
AVL B[TESCEM LS OP LS LP DURS A Fre EA SH MAMA AY rfe SES 
须 保存 和 正确 地 更 新 。 使 用 AVL PASE FF, SEE CE Pe RJ OC NOB TE AI BET 
要 O N aE, ORR ER OP PR US, REM O(N) 最 十 情形 运行 
IE BI AN FTE BSIRIRE, EERE EPA n] SE BA. E Coplay tree) SEHK 种 
PY Soe ,虽然 任意 操作 仍然 需要 GCN ATA) (EER RAL A T UTD ER BAS MAR 
们 可 以 证 时 ,任意 顺序 的 M REPEC SE) ESP DO(MiogN) 最 坯 情形 时 间 。 因 此 ,在 长 时 期 运 
行 中 这 种 数据 结构 的 行为 就 像 是 每 次 操作 花费 O(logN) 时 间 一 样 。 我 们 把 它 称 为 摊 还 时 间 
3- (amortized time bound) - 

fits A Eos por n) e RT E88. ER ALES] TEC CIE EUIS DRE. 由 于 这 个 问题 一 
Be Ri JF A HE , Ae ROR BE a — 36 9L RT E GERE FB IR] B A Fn] Hp 18] EAE PB RA Bk 
ERES CHER. 摊 还 界 比 等 值 的 平均 情形 界 要 强 。 例 如 ,二 . 叉 查 找 树 每 次 操作 的 平均 
时 间 为 OUlogN) ,但 是 对 于 连续 M 次 操作 仍然 可 能 花费 DO(MN) 时 间 。 

党 为 得 到 摊 还 界 需 要 我 们 查看 整个 操作 序列 而 不 是 仅仅 一 次 操作 ,所 以 我 们 希望 我 们 的 
分 析 更 具 技 巧 性 .我们 将 看 到 这 种 期 望 一 般 会 实现 、 

Au ER 

”分析 二 项 队列 操作 - 
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11.1 一 个 无 关 的 智力 问题 


考虑 下 列 问题 ;将 两 个 小 猫 放 在 足球 场 的 对 面 ,相距 100 fo 它们 以 每 分 钟 10 码 的 速度 
相向 行走 。 同 时 ,这 两 个 小 猫 的 母亲 在 足球 场 的 一 端 , 它 可 以 凡 每 分 钟 100 人 码 的 速度 跑步 。 猫 
妈妈 从 一 个 小 猫 跑 到 另 一 只 小 猫 ,来 回 轮 流 跑 而 速度 不 减 ,一 直 跑 到 两 个 小 猫 ( 以 及 它们 的 猫 
妈妈 ) 存 中 场 相遇 - 问 猫 妈妈 跑 了 多 还 ? 

使 用 塞 力 计算 不 难 解决 这 个 问题 。 我 们 把 细节 留 给 读者 ,不 过 ,预计 这 个 计算 将 涉及 旬 计 
筑 无 穷 见 何 级 数 的 和 。 虽 然 这 种 直接 计算 能 够 得 到 答案 ,但 是 实际 上 通过 引信 一 个 附加 谈 量 ， 
Bin. [a] ,可 以 得 到 简单 得 多 的 解法 。 

轩 为 项 个 小 猫 相距 100 码 远 而 且 以 每 分 钟 20 码 的 合 速度 互相 接近 ,所 以 它们 花 5 分 钟 即 
可 到 达 中 场 。 由 于 猫 妈 妈 每 分 钟 跑 100 码 ,因此 她 跑 的 总 距离 是 500 R3. 

这 个 问题 阐述 了 一 个 思路 , 即 有 时 候 间接 求解 一 个 问题 要 比 直 接 求解 容易 。 我 们 将 这 个 


怀 路 用 于 将 要 进行 的 捧 还 分 析 。 我 们 将 引入 一 个 附加 变量 ,叫做 位 势 {( potentia H T E, RN 
能 够 证 明 以 前 很 难 证 贡 的 一 些 结果 : 


11.2 二 项 队列 


我 们 将 要 考查 的 第 一 个 数据 结构 是 第 6 章 中 的 二 项 队列 ,现在 进行 简要 的 复习 。 我 们 知 
道 ,二 项 树 Bo 是 一 棵 单 节 点 本 , 旦 对 于 到 >0, 二 项 树 B, 通过 将 两 棵 二 项 楠 B ;合并 到 一 起 
ifte. “A By 到 Ba 如 图 11-1 FTR. 


图 11-1 二 项 树 B, Bi Bs,B3 和 BB; 


一 棵 一 项 树 的 节点 的 秩 (rank) 等 于 它 的 儿子 节 扩 的 有， Q8 © 
个 数 ,特别 地 ,Bi ARTAR ko IRADE HEY 18 DRC 
二 项 树 的 集合 ,在 这 个 集合 中 对 于 任意 的 & 最 多 可 以 存 (53) 
£—XR BE H,- P 11-2 BAR TA OH, 和 A 3 
Ho. i & Da 

最 重要 的 操作 是 Mergc( 合 并 )。 为 了 合并 两 个 二 项 (8) 
队列 ,需要 执行 类 似 于 二 进 制 整数 如 活 的 操作 ;在任 一 时 
刻 ,我 们 可 以 有 零 . 一 .二 或 可 能 三 棵 及 WH, ERT X 
两 个 优先 队列 是 否 包含 一 栋 B, 树 以 及 是 否 有 一 棵 Bs BURT RA. REE SRR 
B, 树 , 那 么 它 作为 一 神 酝 被 放 到 合并 后 的 二 项 队列 中 ;如 果 有 两 棵 b, BE ,那么 它们 镍 台 并 成 
A B,1 树 并 且 被 并 入 到 结果 中 ;如 开 有 三 襟 Bi 树 ,那么 将 一 棵 作为 树 放 入 到 二 项 队列 中 而 
另 其 棵 则 合并 成 一 棵 且 并 入 到 结果 中 。 厂 ;| AH, 合并 的 结果 如 图 11-3 所 未 。 


"MO a 


图 11-2 两 个 二 项 队列 H A H 





图 11.3 ”二 项 队列 Ha GIF Hi M H, 的 结果 


插 人 操作 通过 创建 一 个 单 节点 二 项 队列 并 执行 一 次 Merge 3E SE AR. IX DA 工作 所 用 的 
时 间 为 M+1, 其 中 M 代表 不 在 该 二 项 队列 中 的 二 项 树 By 的 最 小 型 号 。 内 此 ,向 一 个 有 一 机 
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By 树 亿 没有 B, 树 的 二 项 队列 进行 的 插入 操作 需要 两 步 ， 删除 最 小 元 通过 把 最 小 元 除去 并 
将 康 二 项 队列 分 裂 成 两 个 二 项 队列 ,然后 再 将 它们 合并 来 完成 。 第 6 章 给 出 了 对 这 些 操作 的 
比较 详细 的 解释 。 

我 们 首先 考虑 一 个 非常 篇 单 的 问题 。 假设 我 们 想 要 建立 一 个 含有 N 个 元 素 的 二 项 队列 。 
我 们 知道 ,建立 一 个 含有 N 个 元 素 的 二 叉 堆 可 以 以 OCN) 叶 间 完 成 ,因此 我 们 希望 对 于 二 项 
队列 由 有 一 个 类 似 的 界 。 

声明 : 

N 个 元 素 的 二 项 队列 可 以 通过 UN. COE A TAR O(N) 建 成。 

这 个 声明 如 果 成 立 ,那么 它 就 给 出 一 个 极其 简单 的 算法 。 由 于 每 次 插入 的 最 坏 情 形 时 间 
是 O{logN), 因 此 ,这 个 声明 是 否 成 立 并 不 是 显然 的 。 考 处 到 如 果 将 该 算法 应 用 到 二 叉 堆 , 则 
运行 时 间 将 是 O(NlogN): 

要 想 证 明 这 个 声明 ,我 们 可 以 直接 进行 计算 。 为 了 测 出 运行 时 间 ,我 们 将 每 次 插入 的 代价 
定义 为 一 个 时 间 单 位 加 上 每 一 步 链 接 的 一 个 附加 单位 。 将 所 有 捅 人 的 时 间 代 价 求 和 就 得 到 总 
的 运行 时 间 。 这 个 总 的 时 间 为 N 个 单位 加 上 总 的 链接 步 数 。 第 一 .第 三 ,第 五 以 及 所 有 编号 
为 奇数 的 步 不 需要 链接 ,因为 在 插 人 时 Bo 不 出 现 。 因 此 ,有 - - 半 的 插 人 不 需要 链接 ,四 分 之 
的 括 人 只 需要 一 次 链接 (第 二 ,第 六 .第 十 次 插 人 等 等 ) ADS ~ 的 插 人 需要 两 次 链接 , 等 
等 。 我 们 可 以 把 所 有 这 些 加 起 来 并 确定 用 N 作为 链接 步 数 的 界 , 从 而 证 明 该 声明 。 dud, 
我 们 试 疼 分 析 一 系列 不 仅仅 是 插入 的 操作 的 时 蛋 , 这 种 蛮 力 计算 将 无 助 于 其 后 的 进一步 分 析 ， 
因此 我 们 将 使 用 另外 一 种 方法 来 证 明 这 个 结 昱 ， 

善 虞 一 次 插入 的 结果 。 如 果 在 插入 时 不 出 现 Bu 树 , 那 么 使 用 与 上 面相 同 的 计数 方法 可 
若 这 次 搬入 的 总 代价 是 一 个 时 间 单位 。 现 在 , 捅 人 的 结果 有 了 一 棵 Bo 树 ,这 样 ,我 们 已 经 把 
一 柠 树 添加 到 二 项 树 的 森林 中 。 如 果 存 在 : - 棵 Bo 树 但 是 没有 BAA ERT oc 
的 时 间 。 新 的 森林 将 有 一 棵 B, 树 但 不 再 有 Bo 树 ,因此 在 森林 中 机 的 数目 并 没有 变化 。 化 费 
三 个 单元 时 间 的 .次 插 人 将 创建 一 标 B 树 但 消除 一 梨 Bo 和 Bi 树 , 这 导致 在 森 宁 中 将 减 少 
BER, HSL, APRS SECO ZE PE * 个 单元 时 间 的 一 次 插入 导致 在 森林 中 兆 增 加 
2- c 棵 树 , 这 是 因为 创建 了 一 棵 B. Fm BER FLEURS B; BIOS EcL. 因此 ,代价 昂贵 
的 插入 操作 删除 一 些 树 ,而 低廉 的 插 人 人 却 创 建 一 些 树 。 

A C, 是 第 i 次 插 人 的 代价 。 令 T 为 第 i 次 插入 后 的 树 的 棵 数 。T。=0 为 树 的 初始 棵 
数 ， 此 时 我 们 得 到 不 变 式 

C +(T;- T, 272 (11.1) 
TE 

C,* (T,- T9972 

Ct Ti. - T72 


Cx + (Tx 247 Ty-2) =2 
Cy t+ (Tx 7 Ty-1)=2 
cie; EE KR T, 项 被 消去 ,最 后 38 F 


N 
2, C; 十 Ly = To = 2N 
r=1 


E] 





^. 
21 C, = ZN- (Tx ~ Te) 
:一 上 
考虑 到 Ty) =O LAR N DL AUR Re TN 确实 非 负 . 因 此 (Tv =- Ty SEI. TE 


SIC, S2N 


这 就 证 明了 我 们 的 声明 . 

在 BuildBinomialQueue 例 程 运 行 期 间 ,每 一 次 楠 人 入 有 一 个 最 坏 情 形 运行 时 间 O (ogNN) fH 
是 由 十 整个 例 程 最 多 用 到 2N 个 单位 的 时 间 , Pe xx edi A BT D SEI RE REIR [HIA BT PR 
个 单位 的 时 间 。 

这 个 例子 阐明 了 我 们 将 要 使 用 的 一 般 技 巧 。 数 据 结 构 在 任 一 时 刻 的 状态 由 一 个 称 为 位 势 
(potential) 的 函数 给 出 。 这 个 位 势 函数 相 由 程序 保存 ,而 是 一 个 计数 装置 ,该 装置 将 帮助 进行 
分 析 。 当 一 些 操作 花费 少 于 我 们 允许 它们 使 用 的 时 间 时 , 则 没有 用 到 的 时 间 就 以 一 个 蝎 禹 位 
势 的 形式 “存储 "起 来 。 在 我 们 的 例子 中 ,数据 结构 的 位 势 就 是 树 的 棵 数 。 在 上 加 的 分 析 中 , 当 
我 们 有 一 些 插 人 只 用 到 一 个 单位 而 不 是 规定 的 两 个 单位 的 时 候 , 风 这 个 额外 的 单位 通过 增加 
位 势 而 被 存 情 起 来 以 备 其 后 使 用 。 当 操作 出 现 超出 规定 的 时 间 时 , 则 超出 的 时 间 通 过 位 势 的 
减少 来 计算 。 可 以 把 位 势 看 作 是 一 个 储蓄 账户 。 如 时 一 次 操作 使 用 了 少 于 指定 的 时 间 ,那么 
这 个 差额 就 被 存 鱼 起 来 以 备 后 而 更 昂贵 的 操作 使 用 。 图 11-4 fi B BuildBinomialQueue 对 一 
系列 插入 操作 所 使 用 的 累积 的 运行 时 间 。 可 以 看 到 ,运行 时 间 从 不 起 过 2N ,市 旦 在 任 一 次 插 
人 后 二 项 队列 中 的 位 势 计量 看 存储 量 。 


2N 
92 Total Time 
69 


Total Potential 
Q 4 8 12 16 20 24 28 32 36 40 44 


图 11-4 连续 N IKEA 
一 日 位 势 函数 被 选 定 , 我 们 就 可 写 出 主要 的 方程 : 
Taaa + APotential = Tas isa (11.2) 
T, 是 一 次 操作 的 实际 时 间 RER REV — URE aR PE TS SE DR GEE STH TRI E fi 
如 在 二 叉 查找 树 中 ,执行 一 次 Find( X) MSc Bret ial 1 加 上 包 合 X ai RE. MURR A 
对 整个 序列 把 基本 方程 加 起 来 ,并 日 最 后 的 位 势 至 少 像 初 始 位 势 一 样 大 ,那么 摊 还 时 间 就 是 化 
操作 序列 执行 期 间 所 用 到 的 实际 时 间 的 -个 上 界 。 注 意 , 妆 Tm 在 从 一 个 操作 到 另 一 操作 


eee 2 


变化 时 ,Taworwed 却 是 稳定 的 。 
选择 一 个 位 势 函数 以 确保 一 个 有 意义 的 界 是 一 项 艰难 的 工作 ,不 存在 一 种 实用 的 方法 . 
一 般 来 说 ,在 尝试 过 许多 位 势 函 数 以 后 才能 够 找到 一 个 合适 的 画 数 。 不 过 ,上面 的 讨论 提出 一 
些 法 则 ,这 些 法 则 告诉 我 们 好 的 位 势 丙 数 所 具有 的 一 些 性 质 。 位 势 吗 数 应 该 
。 总 假设 它 的 最 小 元 位 于 操作 序列 的 开始 处 。 选 择 位 势 函 数 的 一 种 常用 方法 是 保证 位 
势 函 数 初始 值 为 0, 而 且 总 是 非 负 的 : 我 们 将 要 遇 到 的 所 有 例子 都 使 用 这 种 方法 。 
。 消 去 实际 时 间 中 的 一 项 。 在 我 们 的 例子 中 , 如 果实 际 的 花费 是 ,那么 位 势 改变 为 
2- c。 当 把 这 些 加 起 来 就 得 到 摊 还 花费 是 2, 这 在 图 11-5 PRH. 


» Insert cast 
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图 11-5 ERFIR E PIR A ERA RE RL 


现在 我 们 可 以 对 二 项 队列 操作 进行 完整 的 分 析 。 

定理 11.1 

Insert , DeleteMin 以 及 Merge 对 于 一 项 队列 的 摊 还 运行 时 间 分 别 是 

Of OClogN) A O(logN). 

WERA: 

位 势 函 数 是 树 的 棵 数 。 初 始 的 位 势 函 数 为 0, 且 位 势 总 是 非 负 的 .因此 摊 还 时 间 是 实际 时 
间 的 一 个 上 界 。 对 Insert 的 分 析 从 上 面 的 论证 可 以 得 到 。 对 于 Merge, 假设 两 棵 树 分 别 
有 NU NS 个 节点 以 及 对 应 的 Ti 和 T: 棵 树 。 令 N= NI + Noo 执行 合并 的 实际 时 间 
3 Otlog( Ni) * log(N3)) = O(ogN)。 在 合并 之 后 ,最 多 可 能 存在 iogN RBI, Ai es 
最 多 可 以 增加 O(logN)。 这 就 给 出 一 个 挫 还 的 界 OClogN). DeleteMin 的 界 可 用 类 似 的 
方法 得 到 。 


11.3 Sy 


二 项 队列 的 分 析 可 以 算是 一 个 容易 的 排 还 分 析 实例 。 现 在 我 们 来 考察 斜 堆 。 像 许多 的 例子 
_ 样 ,一 旦 找到 正确 的 位 势 函 数 ,分 析 起 来 就 容易 了 了。 困难 的 问题 是 选择 一 个 合适 的 位 势 函 数 。 

对 于 斜 堆 , 我 们 知道 关键 的 操作 是 合并 ”为 了 合并 两 个 斜 堆 , 我 们 把 它们 的 右 路 径 合并 并 
使 之 成 为 新 的 左 路 径 。 对 于 新 路 径 上 的 每 一 个 节点 ,除去 最 后 一 个 外 ， 老 的 左 子 树 作为 右 子 树 
而 附 于 其 上 。 在 新 的 左 路 径 上 的 最 后 节点 已 知 没有 右 子 树 ,因此 给 它 一 棵 右 子 树 就 不 明知 了 - 
我 们 所 要 考虑 的 界 不 依赖 于 这 个 例外 ,如 果 例 程 是 递归 地 编写 的 ,那么 这 又 旦 自然 要 发 后 的 入 
m, 图 11-6 显示 合并 两 个 斜 堆 后 的 结 采 - 





图 





图 11-6 AHA TEHE 


设 我 们 有 两 个 斜 堆 HV 日 ; 并 在 各 自 的 右 路 径 上 分 别 有 ri Ari Pad. EE, BUTS 
并 的 实际 时 间 与 ritr 成 正比 ,因此 我 们 将 省 去 大 O i TERE LB SET T Tak 
个 单位 的 时 间 。 由 于 这 些 座 没有 固定 的 结构 模式 ,因此 丙 个 堆 的 所 有 节点 都 位 于 右 路 径 上 的 
情况 是 可 能 发 生 的 ,而 这 将 给 出 合并 两 个 堆 的 最 坏 情 形 的 界 OON) (A 11.3 RKA — 1T 
例子 )。 我 们 将 证 明 人 台 并 两 个 斜 堆 的 排 还 时 间 为 OtlogN)。 

我 们 需要 的 是 能 够 获得 斜 堆 操 作 效 果 的 某 种 类 型 的 位 势 孔 数 。 我 们 知道 ,-- 次 合并 的 效 
果 是 人 外 在 右 路 径 上 的 每 一 个 节点 部 被 移 到 左 路 径 上 ,而 其 原 左 儿子 变 成 新 的 石 儿 了 于。--- 种 想 
法 是 把 每 一 个 节点 算 入 为 右 节 点 或 左 节 点 来 分 类 ,这 要 看 节点 是 右 儿子 还 是 不 是 石 儿子 米 定 ， 
这 时 我 们 把 右 节 点 的 个 数 作为 位 势 函 数 。 虽 然 位 势 初始 时 为 0 并 且 总 是 非 负 的 ,但 是 霹 题 在 
于 这 种 位 势 在 一 次 合并 后 并 不 减少 从 而 不 能 怡 当 地 反映 在 数据 结构 中 的 储备 景 。 这 样 的 结果 
使 该 位 热 限 数 不 能 够 用 来 证 明 所 要 求 的 界 。 

-个 类 似 的 想法 是 把 节点 分 成 重 节点 或 轻 节点 ,这 要 看 任 一 节点 的 右 子 树 上 的 节点 十 从 

比 左 子 树 上 的 节点 名 米 确定 . 

定义 ;一 个 节点 p 如 果 其 右 子 树 的 后 诊 数 至 少 是 该 的 后 裔 总 数 的 一 半 , 则 称 方 点 声 征 

重 的 ,否则 称 之 为 轻 的 。 注意 ,一 个 节点 的 后 裔 个 数 包 括 该 节点 本 身 。 

例如 .图 11-7 表示 一 个 斜 堆 。 关 键 字 为 15.3.6.12 和 7 的 节点 是 重 节点 , 面 所 有 其 他 的 
节点 都 是 轻 节 抬 。 





图 11-7 僚 堆 一 一 其 中 的 重 节 点 是 3.6.7.12 和 15 


我 们 将 竖 使 用 的 位 势 函 数 是 这 些 堆 ( 的 集合 ) 中 的 重 节 点 的 个 数 。 看 起 来 这 可 能 是 一 种 好 
的 选择 ,因为 一 条 长 的 右 路 径 将 包含 非常 多 的 重 节点 。 由 于 这 条 路 么 上 的 节点 将 要 交换 尼 们 
的 子 节点 ,因此 这 些 节 点 将 被 转变 成 合并 结果 中 的 轻 节 点 。 


BLE £o 33] 
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定理 11.2 
合并 两 个 斜 堆 的 摊 还 时 间 为 OlogN). 
证 明 : 


S H A H 为 两 个 堆 , 分 别 具 有 NI 和 N PO. RH, BURIA 1, IER B 
Ha TETA EA 1+ 有 个 节点 。 同 样 ,日 ; dE HO RES EU h 个 轻 节 点 和 6; 个 重 
节点 ,共有 Io thy 个 节点 。 

如 果 我 们 采用 约定 :合并 黄 个 儒 堆 的 花费 是 它们 右 路 径 士 节点 的 总 数 , 那 么 执行 合并 
的 实际 时 间 就 是 2) + 1+ hp + 上。 现在 ,其 重 / 轻 状态 能 够 疏导 的 节点 只 是 邦 些 最 初 位 
于 右 路 径 上 { 并 最 后 出 现在 左 路 径 上 ) 的 节点 ,因为 于 没有 别 的 节点 的 子 树 启 交换， 这 可 
ALT Ad 11-8 中 的 例子 。 





图 11-8 ”合并 后 重 / 痊 状 态 的 变化 


如 果 一 个 重 节 点 最 初 是 在 厂 路 径 上 ,那么 在 合并 后 它 必然 成 为 一 个 轻 节点 。 你 于 下 
路 径 上 的 其 余 那 些 节点 是 轻 节 点 ,它们 可 能 变 成 也 可 能 不 变 成 重 节 点 ,但 是 由 于 我 们 要 证 
明 : 一 个 上 界 ,因此 我 们 必须 假设 最 坏 的 情况 , 即 它们 都 变 成 了 重 节 点 并 使 得 位 势 增 加 .此 
时 , 重 节点 个 数 的 净 变 化 最 多 为 thh -ho WERE EA NA A Eie O E 
(11.2)) 加 起 来 则 得 到 一 个 摊 还 界 202) + lads 

现在 我 们 必须 证 明 i+ h= OUogN). 由 于 瑟 和 2 是 原 右 路 径 上 轻 节 点 的 个 数 ， 
而 一 个 轻 节 点 的 右 子 树 小 于 以 该 轻 节 点 为 根 的 树 的 大 小 的 一 半 , 由 此 直接 推出 右 路 径 上 
轻 节 点 的 个 数 最 多 为 log Ny + log N, ix BRE O(logN) 

注意 到 初始 的 位 势 为 0 而 且 位 势 总 是 非 负 的 ,我 们 的 证 明 也 就 完成 了 -。 验证 这 C 
很 重要 ,因为 否则 捧 还 时 间 就 不 能 成 为 实际 时 间 的 界 调 朋 也 就 没有 意义 了 。 

由 于 Insert 和 DeleteMin 操作 基本 上 就 是 一 些 Merge, 它 们 的 摊 还 界 也 是 O(logN)。 


11.4 ERRE 


在 9.3.2 节 我 们 指出 如 何 使 用 优先 队列 改进 Dijkstra 最 短路 径 算 法 的 粗略 运行 时 间 
OCI vl), 重要 的 现象 是 运行 时 间 被 ; E | 次 DecreaseKey 操作 和 : V [2X Insert 和 DeleteMin 
操作 所 控制 。 这 些 操作 发 生 在 大 小 最 多 为 ,V| 的 集合 上 。 通 过 使 用 二 叉 推 ,所 有 这 些 操 作 花 
费 O(log| V DETE, Age Dijkstra 算法 最 后 的 界 可 以 诚 到 OX .E |log| VI 

为 了 降低 这 个 时 间 界 ,必须 改进 执行 DecreaseKey 操作 所 需要 的 时 间 : 我 们 在 6.5 节 所 
HERES a- 堆 给 出 对 于 DecreaseKey 操作 以 及 Insert 的 Oog; V ATE ,但 对 DeleteMin 的 
FHE OC dlogy| Vl: 通过 选择 d 来 平衡 带 有 VIX DeleteMin 操作 的 | 二 | 次 DecreaseKey 
BE PE BY TE S8, TE ERU d 必须 总 是 至 少 为 2, 那 么 我 们 看 到 d 的 一 个 好 的 选择 是 
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d= maxr(Q,L EI ZA Va 
1718 Dijkstra 算法 的 时 间 界 改进 到 

OC E logos gi vip: VI) 

SPUR AB SHE REA 口 (1) 摊 还 时 间 支 持 所 有 基本 的 堆 操 作 的 一 种 数据 结构 ,但 DeleteMin RI 
Delete 除外 ,它们 花费 OflogN) 的 摊 还 时 间 。 我 们 立即 得 出 ,在 Dijkstra 算法 中 的 那些 堆 操 作 
RS O(E'-IVllogl V|) JIE]. 

45 S8 ME (Fibonacci heap) 人 通过 添加 两 个 新 的 观念 推广 了 二 叉 堆 ， 

DecreaseKey 的 一 种 不 同 的 实现 方法 ;我 们 以 前 看 到 的 那 种 方法 中 把 元 率 朝 同根 节 太 上 . 

滤 。 对 于 这 种 方法 似乎 没有 理由 期 望 O{1}) 的 挫 还 时 间 界 ,因此 需要 一 种 新 的 方法 。 

WR & + (lazy merging): 只 有 当 两 个 堆 需 要 合并 时 才 进 行 合并 。 这 类 似 于 懒惰 删除 。 对 

于 懒 情 合 并 , Merge 是 低廉 的 ,但 是 因为 懒 情 合 并 并 不 实际 把 树 结合 在 一 起 ,所 以 

DeleteMin 操作 可 能 会 遇 到 许多 的 树 , 从 而 使 这 种 操作 的 代价 高 晶 。 任何 一 次 DeleteMin 

都 可 能 花费 线性 时 间 , 但 是 总 能 够 把 时 间 归 答 到 前 面 的 一 些 Merge 操作 中 去 ， 特 列 地 ， 

一 次 昂贵 的 DeleteMin 必须 在 其 前 面 要 有 大 量 的 非常 低廉 的 Merge 操作 ,它们 能 够 储存 

额外 的 位 势 。 

11.4.1 切除 左 式 堆 中 的 节点 

在 二 叉 堆 中 ,DecreaseKey 操作 是 通过 降低 节点 的 值 然后 将 其 朝 着 很 上 涨 直到 建成 堆 序 来 
LMA ERRE F, CER D{logN) 时 间 , 这 是 平衡 树 中 通 向 根 的 最 长 路 径 的 长- 

如 果 代 表 优 先 队列 的 树 不 具有 O(logN) 的 深度 ,那么 这 种 方法 不 适用 。 例 如 , 癌 将 这 种 
FEAF ARH, Ul DecreaseKey 操作 可 能 花费 BCN) 时 间 , 如 图 11-9 中 的 例子 所 示 。 





111-9 通过 上 证 将 N 一 1 递减 到 0 花费 OCN ETT 


我 们 看 到 ,对 于 左 式 虚 来 说 DecreaseKey 操作 需要 另外 的 方法 。 我 位 的 例子 克 图 11-10 中 
的 左 式 堆 ， 假 设 我 们 想 要 将 值 为 9 的 关键 字 减 低 到 0。 若 对 该 堆 变动 , 则 必 将 引起 堆 序 的 本 
坏 ,这 种 破坏 在 图 11-11 中 用 虚线 标示 。 

我 们 不 想 把 0 上 滤 到 根 ,因为 正如 我 们 已 经 看 到 的 ， 存在 一 些 情况 使 得 这 样 做 代价 太 大 。 
铸 决 的 办 法 是 把 堆 沿 着 虚线 切 开 ,如 此 得 到 两 标 树 ,然后 再 把 这 两 棵 树 合并 成 一 檬 。 AXA 
Bi HUT DecreaseKey 操作 的 节点 , 令 P 为 它 的 父 节点 。 在 切断 以 后 我 们 得 到 两 棵 树 , 即 根 为 X 


a 





"这 个 名 字 来 白 于 这 种 数据 结构 的 一 个 性 质 , 丘 窗 我 们 车 FA Wurm. 


5 E ox OF 333 


的 HR D, T 是 原来 的 树 除去 H 后 得 到 的 树 ， 具 体 情况 如 图 11-12 Bro. 





图 11-12 切断 之 后 得 到 的 两 棵 树 


如 果 这 两 棵 树 都 是 左 式 堆 ,那么 它们 可 以 以 时 间 O(logN) 合 并 ,整个 操作 也 就 完成 了 。 
容易 看 出 ,Hi 是 左 式 堆 ,因为 没有 节点 的 后 裔 发 生变 化 。 由 于 它 的 所 有 节点 原本 就 满足 左 式 
堆 的 性 质 , 因 此 现在 仍 将 必然 满足 。 

然而 ,这 种 方案 似乎 还 是 行 不 通 ,因为 了 未 必 是 左 式 堆 。 不 过 ,容易 恢复 左 式 堆 的 性 质 ， 
这 要 用 到 下 列 两 个 观察 到 的 结论 : 

- HAM P BT, 的 根 的 路 径 上 的 节点 可 能 破坏 左 式 堆 的 性质 ;它们 可 以 通过 交换 子 闻 

点 来 调整 。 
。 由 于 最 大 右 路 径 长 最 多 有 | log(N + 1)J 个 节点 ,因此 我 们 只 需 检查 从 P 到 T. AR ADRS 
径 上 的 前 Llog(N+1)J 个 节点 。 图 11-13 显示 了 H, 和 将 T: 转变 成 天 式 堆 后 的 HS. 

因为 我 们 能 够 以 O (logN) 步 将 T 转变 成 左 式 堆 HH;， 然 后 合并 Hi 和 及;， 所 以 我 们 

得 到 一 个 在 左 式 截 中 执行 DecreaseKey H O UoN) 算法 。 图 11-14 显示 的 堆 是 该 例 的 最 后 
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R 11-13. 将 Ts 转变 成 左 式 堆 H 后 的 情形 


Ü 





图 11-14. 通过 合并 万 | 和 Hs 而 完成 操作 DecresseKey( H, X ,9) 


11.4.2 二 项 队列 的 懒 情 合并 

出 斐 波 那 契 堆 所 使 用 的 第 二 个 想法 是 同 惰 合并 {lazy merging)。 我 们 将 把 这 个 想法 用 于 
二 项 队列 并 证 明 执 行 一 次 Merge 操作 (还 有 插入 操作 , 它 是 一 种 特殊 情形 ) 的 挫 还 时 间 为 
Of 对 于 DeleteMin ,其 摊 还 时 间 仍 然 是 OQ (ogN)。 

这 个 想法 如 下 :为 了 合并 两 个 二 项 队列 ,只 要 把 两 个 二 项 树 的 表 连 在 -- 起 ,结果 得 到 - -个 
新 的 二 项 队列 。 这 个 新 的 二 项 队列 可 能 含有 相同 大 小 的 多 标 树 ,因此 破坏 二 项 队列 的 性 奈 。 
为 了 保持 一 致 性 ,我 们 将 把 它 叫做 懒 屏 二 项 队列 (lazy binomial queue). 这 是 一 种 快速 操作 ,该 
操作 总 是 花费 常数 (最 坏 情 形 ) 时 间 。 和 前 面 一 样 ,一 次 插 和 人 通过 创建 一 个 单 节点 二 项 队列 并 
将 其 合并 而 完成 。 区 别 在 于 合并 是 懒惰 的 。 

DeleteMin 操作 要 麻烦 得 多 ,因为 此 处 需要 我 们 最 终 把 懒 饶 二 项 队列 转变 加 到 标准 的 一 贰 
队列 , 不 过 , 正如 我 们 将 要 证 明 的 , 它 仍然 花费 O(logN ) 的 捧 还 时 间 而 不 像 以 前 是 
OUlogN) 最 坏 情 形 时 间 。 为 了 执行 DeieteMin ,我 们 找 出 { 并 最 终 返 回 ) 最 小 元 素 。 如 前 所 述 ， 
我 们 将 它 从 队列 中 删除 ,使 得 它 的 每 一 个 子 节 点 都 成 为 一 棵 新 的 辆 。 此 时 我 们 通过 合并 两 标 
相等 大 小 的 树 直 至 不 再 可 能 合并 为 止 而 把 所 有 的 树 合并 成 一 个 二 项 队列 。 

例如 ,图 11-15 表示 一 个 懒惰 二 项 队列 。 在 一 个 懒惰 二 项 队列 中 ,可 能 有 多 于 ~ 棵 的 树 有 
相同 的 大 小 。 为 了 执行 DaleteMin ,我 们 同色 前 那样 把 最 小 的 元 素 删 除 ,并 得 到 加 11-16 中 

436 ”的 树 。 


图 11.15 懒惰 二 项 队列 
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FN 11-16 在 删除 最 小 元 素 13) 后 的 懒惰 二 项 队列 


现在 我 们 必须 将 所 有 的 树 合并 庙 得 到 一 个 标准 的 二 项 队列 。 一 个 标准 的 二 项 队 放 每 个 其 
上 最 多 有 一 棵 树 。 为 了 有 效 地 进行 这 项 工作 ,我 们 必须 能 够 以 正比 于 出 现在 (T) 中 树 的 棵 数 
的 时 间 ( 或 log ,哪个 大 用 哪个 ) 完 成 Merge。 为 此 ,我 们 构造 表 的 一 个 数组 : Los Lisos 
Lg o AP Rs 是 最 大 的 树 的 秩 。 每 个 表 Le BARAR 的 所 有 的 树 。 然 后 应 用 图 11-07 
中 的 过 程 。 


/*2*/ while |Lg! 2 2 do 
i 


/* 3*/ Remove two trees from ig; 
f* 4*/ Merge the two trees into a new tree; 
f* SR Add the new tree to Lei1: 


} 





图 11-17 恢复 二 项 队列 的 过程 


每 通过 一 次 过 程 中 从 第 3 行 到 第 5 行 的 循环 , 树 的 总 棵 数 都 要 减少 1。 这 意味 着 ,这 部 分 
每 次 执行 都 花费 常数 时 间 的 代码 只 能 够 执行 工 -1 次 ,其 中 人 是 树 的 棵 逆 。 这 里 的 for 循环 
计数 和 while 循环 未 尾 的 检测 花费 OtlogN) 时 间 , 这 使 得 运行 时 间 成 为 所 要 求 的 OCT + 
logN)。 图 11-18 显示 该 算法 对 前 面 二 项 队列 的 集合 的 执行 情况 。 
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图 11-18 ”把 一 些 二 项 树 合并 成 -个 一 项 队列 
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懒 情 二 项 队列 的 摊 还 分 析 
为 了 进行 懒惰 二 项 队列 的 捧 还 分 析 .我们 将 用 到 将 标准 二 项 队列 所 使 用 的 相同 的 位 势 函 
数 ” ”有 因此, 懒 情 二 项 队列 的 位 势 是 树 的 棵 数 。 
定理 11.3 
Merge 和 Insert 的 摊 达 运行 时 间 对 于 悚 情 王 项 队列 均 为 {1)。DeletreMin 的 挫 还 运 

行 时 间 为 O(logN )。 

WERB: 

这 里 的 位 势 函 数 为 二 项 队列 集会 中 树 的 棵 数 。 anf p rS 0 i HAES EE OR 

的 。 因 此 ,经过 一 系列 的 操作 之 后 ,总 的 挫 还 时 间 是 总 的 运行 时 间 的 一 个 上 界 : 

对 于 Merge 操作 ,实际 时 间 为 常数 ,而 二 项 队列 的 集 人 台中 的 树 的 棵 数 足 不 变 的 ,内 

此 ,由 方程 (11.2) 可 知 挫 还 时 间 为 O(1)。 

对 于 Insert 操作 ,其 实际 时 间 是 常数 ,而 桂 的 简 数 最 多 增加 1, 因此 捧 玉 时 间 为 0(1)。 
操作 DeleteMin 比较 复杂 。 令 R 为 包含 最 小 元 素 的 树 的 秩 , 而 令 了 是 树 的 棵 数 ， 于 十 ， 
在 DeleteMin 操作 开始 时 的 位 势 为 了 。 为 执行 一 次 DeleteMin, 最 小 节点 的 各 子 节点 被 分 
离开 而 成 为 一 棍 一 梯 的 树 。 这 就 产生 了 TOR ORBI ,这 些 树 必 须要 合并 成 - .个 慰 准 的 二 
BAR). RK O 记 导 中 的 常数 ,那么 根据 上 面 的 论述 可 知 , 热 行 该 操作 的 实际 时 
间 为 T+ 民 +IogN.S 另 一 方面 , 巨人 敌 完 这 些 , 剩 下 的 最 多 可 能 还 有 log N PRT Alte fi 
势 函 数 最 多 可 能 增加 (logN) — T。 把 实际 时 间 和 位 势 的 变化 加 起 来 得 到 扒 还 时 间 界 为 
2logN+ 玉 。 由 于 所 有 的 树 都 是 二 项 树 , 因 此 我 们 知道 R<logN. A. RT 到 
DeleteMim EAE ER BI [8] FRO Clog N) ; 
11.4.3 SEIEHBSOHERRE 
下 如 我 们 前 面 提 到 的 SE iy Of S ME hE DecreaseKey 操作 与 懒惰 二 项 队列 Merge je 
作 结合 起 来 。 不 过 ,我 们 不 能 一 点 修改 也 不 做 而 使 用 这 两 种 操作 -。 问题 在 于 ,如 果 在 这 些 二 项 
树 中 进行 任意 切割 ,那么 结果 得 到 的 森林 将 不 再 是 二 项 树 的 集合 。 因此 ,每 一 棵 树 的 秩 最 多 为 
i logN | 将 不 再 成 立 。 由 于 在 微 情 二 项 队列 中 DeiereMin 的 摊 还 时 间 已 被 证 骨 是 2logN + R.A 
此 ,对 F DeleteMin 的 界 我 们 需要 R — O 〇 (ogN) 成 并 。 

为 了 保证 只 = O(logN) ,我 们 对 所 有 的 非 根 节点 应 用 下 述 法 则 |: 

。 将 第 一 次 (因为 切除 而 ) 失 去 一 个 子 节点 的 ( 非 根 ) 节 点 做 上 标记 。 

， 如 果 被 标记 的 节点 又 失去 万 外 一 个 儿子 节点 ,那么 将 其 从 它 的 父 节点 切除 .这 个 节 后 
现在 恋 成 了 一 棵 分 离 的 树 的 根 并 且 不 再 被 标记 . 这 叫做 一 次 级 联 切 除 (eascading 
cut} ,因为 在 一 次 DecreaseKey 操作 中 ' 可 能 出 £i dc RIK AP TORR 

图 11-19 显示 在 DecreaseKey ETE BU ERAR RHE F BARB 当 关 键 字 为 a9 A E 

成 12 KIHE HERP RR . 因此 .该 节点 从 辫 的 父 节 点 中 切除 , 变 成 了 一 棵 新 树 的 根 。 由 于 也 
含 33 的 节点 被 标记 ,这 是 蕊 的 第 二 个 失去 的 子 节点 ,从 而 它 也 被 从 它 的 父 节 点 (1i0) 中 切除 - 
现在 ,10 也 失去 了 它 的 第 二 个 包子 ,于 是 它 又 从 5 PHR, 这 个 过 程 到 这 里 结束 ,因为 5 是 林 
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作 标 记 的 . 现在 把 节点 5 作 上 标记 SSR aS 11-20 所 示 . 


Ye 23) Q2) (74 (47) 

63) Q9 

(33) (39) 
(t) (46) 


图 11-19 4 39 EX, 12 SBE ISCHD EP ER 
GS — Q5 (9 (Q3 
(6) 


图 11-20 在 DecreaseKey $R IE 2c fei SEED SOR 85 HI Ex 


注意 ,过 去 被 作 过 标记 的 节点 10 和 33 不 再 被 标记 , 圭 为 现在 它们 都 是 根 节点 。 这 仁 时 间 
界 的 证 明 中 是 极其 重要 的 。 
11.4.4 时 间 界 的 证 了 明 
注音 ,标记 节点 的 原因 是 我 们 需要 给 任 一 节点 的 秩 R( 子 节点 的 个 数 ) 确 定 一 个 界 。 现 体 
我 们 证 明 具 有 N P REFECTI SRL ON O Clog N 
5138 11.1 
S 总 是 斐 波 那 契 堆 中 的 任 一 节点 S c 为 XX 的 第 i 个 最 年 轻 的 儿子 ， 则 c, BOT RIPE 
i-2. 
WRA: 
在 c 被 链接 到 X 上 的 时 候 ,X 已 经 有 (年 长 的 ) 儿 了 予 cl,cz,… .ce -1 于 是 , 当 链接 到 “ 
WX 至 少 有 ;二 个 儿子 。 由 于 节点 只 有 当 它们 有 相同 的 秩 的 时 候 才 链接 ,由 此 可 知 在 c, 
被 链接 到 X 上 的 时 候 c 至 少 也 有 ;一 1 个 儿子 ,从 这 个 时 候 起 , 它 已 经 至 多 失去 一 个 于 
节点 ,不 然 的 话 它 就 已 经 被 从 X 切除 。 因 此 ,c, 至 少 有 ;一 2 个 儿子 。 
从 引 理 11.1 容易 证 明 , 秩 为 R 的 任意 节点 必然 有 许多 的 后 商 。 
引 理 11.2 
^ FF 是 由 Fo=1,Fi=1; 以 及 Fe = Feo + 下 -2 定义 ( 记 1.2 TT ASSES DES RA 
REVERED ASDA Fei NAR AREAS). ; 
iE RA: 
A Sp 是 秩 为 R 最 小 的 树 。 显 然 ,So=1 和 $1=2. 根据 引 理 11.1 AR ER A A 
Reb R-2,R—-3,..-,1, 810 的 子 树 , 再 加 上 另 一 棵 至 少 有 -- 个 节点 的 子 树 。 连 辣 
Sr 的 根本 身 一 起 ,这 就 给 出 Ss = 2+ Sg S; BY Spo 的 一 个 最 小 值 。 和 容易 征明， 
Sp = Fes) (GRA 1.98). 
[3 2 x ig AE ERR OE DS RE Bs ^ JE ER ERU PR ae 
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ZH OOGogs)- FE. RITE: 
引 理 11.3 
SER AN SHEET ARRA O(logN). 
证 朋 : 
直接 从 圭 曾 的 讨论 得 出 。 
假如 我 们 所 甘心 的 由 是 Merge, Insert 以 及 DeleteMin 等 操作 的 时 间 界 ,那么 我 们 现在 本 
ATUL PULA TPE “OR SERED REN SME MFR BRR) -个 对 于 
DecreaseKey AY O CORIIBESR . 
对 于 一 次 DecreaseKey 操作 所 需要 的 实际 时 间 是 1.00 E EE BE EBA ed PT HUE; 8928 XX D ER 
的 次 数 。 由 于 级 联 切除 的 次 数 可 能 会 比 口 (1) 多 很 多 ,为 此 我 们 需要 用 位 势 的 损失 米 作 为 补 
FE. MB 11-20 我 们 看 到 , 树 的 棵 数 实 际 上 是 随 着 每 次 级 悦 切 陈 而 增加 ,因此 我 们 必须 增 蝇 位 
势 函 数 , 使 它 包 含 莫 种 在 级 联 切 除 期 间 能 够 递减 的 成 分 。 注 意 ,我 们 不 能 从 位 擂 函 数 中 抛 开本 
的 棵 数 , 央 为 这 样 就 不 能 够 让 有 明 Merge 操作 的 时 间 界 了 .再 次 观察 图 11-20 RIAA ,级 联 切 
除 引 起 被 标记 的 节点 的 个 数 的 减少 ,因为 每 个 识 级 联 切 除 分 出 的 节点 部 灾 成 了 本 标 沁 的 很 。 
出 于 级 联 切 除 花费 1 个 单元 的 实际 时 间 并 将 树 的 位 势 增 加 1, 因此 我 们 将 每 个 标记 的 广 操 算 
WE 2 个 位 势 单 位 。 利 用 这 种 方法 ,我们 就 获得 一 种 消除 级 联 切 除 次 数 的 机 会 : 
定理 11.4 
Jeo HE EME STF insert. Merge 和 DecreaseKey AY BER AT A OY O (1). 而 对 于 
DeleteMin We O(logN). 
ur AA: 
位 势 是 辈 波 那 贺 堆 的 集合 中 树 的 棵 数 如 上 丙 倍 的 标记 节点 数 。 像 通常 一 样 , 官 始 的 伺 共 
为 和 并 且 总 是 非 鱼 的 ， 于 是 ,经 过 一 系列 操作 之 后 ,总 的 摊 还 时 间 则 号 总 的 实际 寺 间 的 - 
PEF, 
对 于 Merge FAVE, KER WAR, MAIC SEA) E DER. He E 
(11.2) , 摊 还 时 间 为 O 〇 (1); 
对 于 Insert 操作 ,实际 时 间 是 常数 , 树 的 梨 数 增加 1, 而 标记 节点 的 个 数 不 变 。 因 此 ， 
立 势 最 多 增加 1 ,所 以 摊 还 时 间 也 是 Ot1). 
对 于 DelereMin 操作 . 令 R 为 包含 最 小 元 素 的 树 的 秩 , 并 令 了 是 操作 前 竺 的 棵 数 。 
六 执行 一 次 DeletcMin ,我 们 再 一 次 将 笠 的 儿子 分 离 , 得 到 另外 R 棵 新 的 树 。 注 意 ,虽然 
这 { 通 过 使 它们 成 为 未 标记 的 根 ) 可 以 除 天 一 些 标记 的 节点 ,但 却 不 能 创建 另外 的 标记 节 
下 这 民 棵 新 树 , 和 其 余 T Mit TEMAS ,根据 引 理 11.3 其 化 费 为 了 了 +R+ 
logN 二 T+ O(logN)。 由 于 最 多 可 能 有 O(logN) RA, 而 标记 节点 的 个 数 又 不 可 能 增 
加 ,因此 位 势 的 变化 最 多 是 O(logN) ~ T. 将 实际 时 间 和 位 势 的 变化 加 起 来 则 得 到 
DeleteMin 的 O Cog N EIJE 7r. . 
最 后 考虑 DecreaseKey PATE. 4 C 为 级 联 切 除 的 次 数 。DecreaseKey 的 实际 花费 为 
C+1, 它 是 所 执行 的 切除 的 总 数 。 第 一 次 ( 非 级 联 ) 切 除 创建 一 宛 新 树 从 而 使 位 势 增 1. 
每 次 级 联 切除 都 建 立 一 棵 新 树 ,但 却 把 一 个 标记 节点 转变 成 未 标记 的 ( 恨 ) 节点 ,合计 每 次 
级 联 切 除 有 一 个 单位 的 兆 损 失 最 后 一 次 切除 岂可 能 把 一 个 术 标 记 节 点 (在 巍 11-20 中 
这 个 节点 为 5) 转 变 成 标记 节点 ,这 就 使 得 位 势 增 加 2。 因此 ,位 势 总 的 变化 最 多 是 3 一 CC。 
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把 实际 时 同和 位 势 变 化 加 起 来 则 得 到 总 和 为 4, 即 OC). 
11.5 伸展 树 


作为 最 后 一 个 合子 ,我们 来 分 析 伸 展 树 的 运行 时 间 。 出 第 4 章 得 知 ,在 对 某 项 X 进行 访 
问 之 后 ,- : 步 展 开通 过 下 述 三 种 一 系列 的 树 操作 将 X 移 至 根 处 : 单 旋转 (zig) Z F (zig-zag) 
旋转 和 一 字形 (zig-zig) 旋 转 。 树 的 这 些 旋转 如 图 11-21 所 示 。 我 们 约定 :如 果 在 节点 入 执行 
-次 树 的 旋转 ,那么 旋转 前 P 是 它 的 父 弛 点 ,G 是 它 的 祖父 节点 (车 X 不 是 根 的 儿子 的 话 )。 
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图 11-21 单 旋转 、 之 字形 和 一 字形 双 旋 转 操作 ,每 个 都 有 一个 对 称 的 情形 (未 示 出 》 


我 们 知道 ,对 节点 X 任意 的 树 操作 所 顷 的 时 间 正 比 于 从 根 到 X 的 路 径 上 的 节点 的 个 数 。 
如 果 我 们 把 每 个 单 旋转 操作 计 为 一 次 旋转 ,把 每 个 之 字形 操作 或 一 字形 操作 计 为 两 次 旋转 OG 
么 任何 访问 的 花费 等 于 1 加 上 旋转 的 次 数 。 

为 了 证 明 展 开 操 作 的 O(logN ) 捧 还 时 间 界 ,我 们 需要 一 个 位 势 函 数 ,该 函数 对 整 个 展开 
操作 最 多 能 够 增加 O(logN) 而 且 在 操作 期 间 也 消除 所 执行 的 旋转 的 次 数 。 找 出 满足 这 些 原 
则 的 位 势 函 数 根本 不 是 一 件 容 易 的 事情 。 首 先 容易 猜 到 的 位 势 两 数 或 许 就 是 树 上 所 有 节点 的 
深度 的 和 。 这 个 猜测 行 不 通 ,因为 位 势 在 一 次 访问 期 间 可 能 增加 6(N)。 当 一 些 元 素 以 连贯 
顺序 插入 时 会 有 这 样 的 典型 例子 发 生 。 

一 个 确实 有 效 的 位 势 函 数 胸 定 义 为 

P(T) = X logSCi) 


ET 
其 中 5S( 站 代表 i Bus BT CR i Bt). 这 个 位 势 函 数 是 对 树 本 所 有 节点 i 其 取 的 
SCO 的 对 数 和 。 
为 简化 记号 S EX: 

R(i)-logSCi) 
这 使 得 

®(T) = LR) 
Ri 代表 节点 i BUE 这 个 术语 类 似 于 我 们 在 不 相交 和 集 算法 分 析 .二 项 队列 和 斐 波 那 契 堆 中 
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APRA AGE. FER XUI AE BEI E SCA PUR Ee ATS], AR RK 
小 的 对 数 的 阶 ( 幅 度 , magnitude), SE FRAN SY RHE, IB A ERE RE ROT) = 
logN 。 用 秩 的 和 作为 位 势 函 数 类 似 于 使 用 高 度 的 利 作为 位 势 渭 数 。 重 要 的 差别 在 于 , 当 一 次 
旋转 可 以 改变 树 中 许多 节点 的 高 度 时 , 却 只 有 OX PAG 的 秩 发 生变 化 。 
在 证 明 主 要 的 定理 之 前 ,我 们 需要 下 列 的 引 理 . 
引 理 11.4 
An a+ bic, tL a Me HAERA IA 
loga + logh=2loge 一 2 
TEAR : 
根据 算术 -几何 平均 不 等 式 ， 
J abtalatb)f 
于 是 
V abszc/2 
WAFA 
abc" /4 
Pi F ROT A E ERR UE 
我 们 现在 就 来 证 明 主要 定理 ,证 明 过 程 中 要 注意 所 用 到 的 一 些 预 备 知 识 ，。 
定理 11.5 
在 节点 X 眶 开 一 襟 根 为 汗 RRE RTL RE D 3CRCT) - R(X)) + 17 O(logN), 
VERA. 
WBA 了 中 节点 的 秩 的 各 。 
如 果 XET 的 根 ,那么 不 存在 旋转 ,因此 位 势 没有 变化 。 访 问 该 节点 的 时 间 是 1; 于 
是 . 捧 还 时 间 为 1 ,定理 成 立 。 因 此 ,我 们 可 以 假设 至 少 有 一 次 旋转 
对 于 任意 一 步 展 开 操作 , 令 R,(X) 和 S,(X) 是 在 这 步 操作 前 X. 的 秩 和 大 小 ,并 令 
R,(X) 和 SCX) 是 在 这 步 展开 操作 后 EMAD. 我们 将 证 明 对 一 次 单 旋转 所 需 竖 
的 摊 还 时 间 最 多 为 3CR, CX) - R,(X)) +1, 而 对 一 次 之 字形 旋转 或 一 字形 旋转 的 摊 述 时 
问 最 多 为 3(RA(X) - R,(X))。 我 们 将 证 明 , 当 我 们 对 所 有 各 步 展 开 求 和 时 ,所 得 到 的 和 和 
就 是 想 要 的 了 时间 界 。 
一 步 单 旋转 :对 于 单 旋 转 sc ste a Ag Comi rS GU RX) * RP) RX) - 
MP)。 注 意 ,位 盆 变化 容易 计算 ,因为 只 有 X. 的 和 P 的 树 大 小 有 变化 。 TÆ, 
AT ag = 14+ RjCX) + RCP) - RX) - RAP) 
从 图 11-21 我 们 看 到 S,(P)SSAP), AE R (PZR (P). 2t, 
ATE + Ry(X) —RAX) 
HF S CX) 8,0), FE RIO - R(X) 220, RERET ED 00 H el 
AT, EI +3( R(X) ~ R(X)) 
_ 步 之 字形 旋转 :对 于 这 种 情况 ,实际 的 花费 是 2, 而 位 势 变 化 为 RiCX)+ RUP + 
R,(G)-R,(X)-R,CP)- RAG). PORES PRE TA 
AT ieg 727 R(X) + RCP) t R(G) - ROX) - RCP) - RCG) 
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从 图 11-21 我 们 看 到 ,Sy(X) = S,(G), 于 是 它们 的 秩 必然 相等 。 因 此 我 们 得 到 
AT gong =2+ RAP)+ R(GG) - RCX) - RCP) 
我 们 还 看 到 SCP) 关 3S(X) 因而 R(X SR CP), RABE 
AV oea 2 + RAP) + R(CG) -2RCX) 
从 图 11-21 我 们 看 到 Sr(P)+ SG 过 SOX)。 如 果 我 们 应 用 引 理 11.4, 那 么 我 们 得 到 
logS;(P) + logs CG)x2logS; CX) -2 
由 秩 的 定义 可 知 , 它 变 成 
R,CP) * RCG)&2R,CKX) - 2 
我 们 将 其 代入 则 得 
ATA ws ERARUX) - 2R,X) 
2 RX) - RCX)) 
由 于 R-CX)SR, CX). REETA 
AT agag A RAX) 7 R(X)) 

-- 步 一 字形 旋转 :第 三 种 情况 是 一 字形 旋转 。 这 种 情形 的 证 明 非 常 类 似 于 之 字形 的 
情形 。 重 要 的 不 等 式 是 RQOX) = RG) R X) R/ (CP), RSCX) SR CP), JAK 
$,(X) + S(G)SS/(X), 我 们 把 具体 细节 留 作 练习 11.8, 

整个 展开 的 摊 还 花费 是 各 生 展 开 的 梭 还 花费 的 和 . 图 11-22 hace rZ 的 一 次 展开 
中 所 执行 的 各 步 展 开 的 过 程 。 令 R(2) RO) RDA Rs(2) 是 这 4 RRA 2 的 
佚 。 第 一 步 是 之 字形 旋转 ,其 花费 最 多 为 3(RQ0) - Ri(2))。 第 一 步 足 一 下 形 旋 转 , 其 花费 
W 3R (2) - R(2))。 最 后 一 步 是 单 旋转 ,花费 不 超过 3(R4(2) -Rs(2)+1o 因 此 总 的 花 
WEG) 7 R02) + lo 





图 11-22 在 节点 2 展开 中 涉及 到 的 展开 各 步 


_. 般 地 ,通过 把 所 有 旋转 -一 其 中 最 多 有 一 个 旋转 可 能 是 一 次 单 旋转 一 一 的 捧 还 时 间 
加 起 来 ,我 们 看 到 ,在 节点 六 展开 的 总 的 时 间 最 多 为 3( Rj(X) ~ R(X))+1, 其 中 ROO 
在 第 _. 步 展开 前 的 秩 , 而 ROO X 在 最 后 一 步 展开 后 的 秩 。 由 于 最 后 一 次 展开 把 X 
留 在 根 处 ,因此 我 们 得 到 3(RJT) - ROO) +1 HIBER TAH Olg ND. 
因为 对 一 棵 伸展 树 的 每 一 次 操作 都 需要 一 次 展开 ,因此 任意 操作 的 捧 还 时 间 是 在 一 次 展 
开 的 反 还 时 间 的 .个 常数 倍数 之 内 。 因 此 ,所 有 伸展 本 操作 花费 O(log MRENA, E 
使 用 更 一 般 的 位 势 函数 ,能 够 证 明 伸展 树 具有 若干 显著 的 性 质 。 更 多 的 细节 在 练习 中 讨论 。 
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总 结 


我 们 在 这 一 章 看 到 捧 还 分 本 是 如 何 用 于 在 一 些 操 作 问 分 配 负 向 。 为 了 进行 分 析 , 我 们 构 
造 - -个 虚构 的 位 势 函数 ,这 个 位 势 晒 数 度量 系统 的 状态 。 高 位 势 的 数据 结构 是 易 变 的 , 它 建 立 
在 相对 低廉 的 操作 之 上 上 。 当 昂贵 的 花费 来 各 一 次 操作 的 时 候 , 它 会 由 前 面 一 些 操 作 节 消 下 的 
PABA. 可 以 把 位 势 看 成 是 对 付 灾难 的 潜能 ,因为 非常 昂贵 的 操作 只 有 在 数据 结构 其 有 
一 个 高 位 势 以 及 已 经 使 用 的 时 间 比 规定 的 时 间 少 很 多 时 才 可 能 此生 。 

数据 结 梅 中 的 低位 势 意 昧 着 每 次 操作 的 花费 大 致 等 于 指定 给 它 的 消耗 量 。 贡 位 执意 味 着 
欠 俩 ;花费 的 时 间 多 于 规定 的 时 间 ,因此 分 配 ( 或 摊 还 ) 的 时 间 不 足 一 个 有 意义 的 界 。 

下 如 方程 {11.2) 所 表达 的 ,一 次 操作 的 摊 还 时 间 等 于 实际 时 间 和 位 势 变化 的 和 。 整 个 拉 
作 序 列 的 摊 还 时 间 等 于 总 的 序列 操作 时 间 加 上 位 势 的 净 变 比 。 只 要 这 个 请 变化 是 正 的 ,那么 
峻 还 界 就 提供 实际 有 时间 花费 的 一 个 上 界 并 且 是 有 意义 的 。 

选择 位 势 函 数 的 关键 在 于 保证 最 小 的 位 势 要 产生 在 算法 的 开始 ,并 使 得 位 势 对 低廉 的 操 
作 增加 而 对 高 昂 的 操作 减少 。 重 要 的 是 过 剩 或 节省 的 时 间 要 由 位 势 中 相反 的 变化 来 度量 。 不 
幸 的 是 ,有 了 时候 这 说 着 容 多 做 起 来 难 。 


练习 


1.1 什么 时 候 向 一 个 二 项 队列 进行 连续 M 次 捅 入 的 化 费 少 寸 2M 个 时 间 单 位 的 时 间 ? 
11.2 设 建立 一 个 有 N = 站 一 | 个 元 素 的 二 项 队列 , 交 蔡 进行 M 对 Insert 和 DeleteMin $$ 
作 。 显 然 ,每 次 操作 花费 OUlog N) 时 间 。 为 什么 这 与 捅 和 的 OC FERC ABA 
H? 
,11.3 通过 给 出 一 系列 导致 一 次 台 并 需要 G@(N) 时 间 的 操作 , ERR FERR a RE 
操作 的 O(log N) 捧 还 界 椒 能 转换 成 最 坏 情 形 界 。 
4 ”指出 如 何 进行 一 未 自 项 向 下 地 合并 两 个 斜 淮 并 将 合并 的 花费 减 到 O(1) 捧 还 时 间 ， 
5 扩展 斜 堆 以 支持 具有 O 〇 (log NOPEXSETIRISS DecreaseKey EE. 
11.6 SESUARESENE RHEE ESO Ej EAF Dijkstra 算法 时 的 性 能 。 
7 SEPARA BERE SEHR EREA APUL OR ILE UR FUOD. dü 
出 如 何 减少 指针 的 数量 而 运行 时 间 花 费 最 多 是 一 个 常数 央 十 。 
11.8 ”让 明 一 次 一 字形 展开 的 摊 还 时 间 多 为 3(RA(X) Ri( XX))。 
11.9 ”通过 改变 位 势 函数 能 够 证 明 展 开 的 不 同 的 界 。 令 权 靖 数 (weight function) 三 (为 指定 
给 树 中 等 个 节点 的 某 个 函数 , 令 SOA i 为 根 的 子 树 上 所 有 节点 (包括 节 太 i AE) 
的 权 的 种 。 对 于 与 用 在 展开 界 的 证 明 中 的 该 咕 数 相对 应 的 所 有 的 节点 ,特殊 情况 为 
W(i)=1.2 N 为 树 中 节点 的 个 数 ,并 令 M 为 访问 的 次 数 。 证 明 下 列 两 个 定理 : 
a. 总 的 访问 时 间 是 OCM + (M+ N)logN). 
«b. 如 果 g, 为 项 i 被 访问 的 次 数 , 而 对 所 有 的 i,q; >0, 那 么 总 的 访问 时 间 为 


N 
O(M + >} ¢,log(M/qi)} 


1 10 a 指出 如 何 实 现 对 伸展 树 的 Merge 操作 使 得 从 N 个 单元 素 树 开始 的 任意 六 -1 
次 Merge 操作 序列 花费 OCNIog? NN) 时间。 
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«b. 将 这 个 界 改 进 为 OC Nlogn ). 

11.11. 我 们 在 第 5 章 描述 了 再 散 列 (rcehashing) : 当 一 个 表 的 表 元 素 超 过 容量 一 半 的 时 候 , 则 
构造 一 个 了 荫 倍 天 的 新 表 , 且 整个 老 表 要 重新 被 散 刚 。 使 用 位 势 函 数 给 出 一 个 正式 的 
摊 还 分 析 来 证 明 一 次 播 人 操作 的 摊 还 时 间 为 OL) 

11.12 证 明 , 如 果 不 允许 删除 ,那么 到 一 株 六 节点 2-3 树 的 任意 顺序 的 M 次 插入 操作 产生 
O(M+N) RDA. 

11.13 BOR SEAR BY RCo BAS C deque) E d — 382331) Ze B p A He S A , Of USE EAT Op ORR 
fE: 
PushC X , D) 35238. X FRA BUD BA II D. 的 前 端 。 
Pop( D) : MG BA D 中 除去 前 端 项 并 将 它 返 四。 
Inject(X,D) :把 项 X HABIA AS] D BY Beha. 
Eject(D): Maha BA 9| D 中 除去 尾 端 项 并 将 它 返 回 。 
FindMin( D ) :3& [8 XX sgg BA 91] D 的 最 小 项 。 
a. di nef DARET ETE AS EA ER] PR ERE 

«b. 描述 如 何以 每 个 操作 常数 最 坏 情 形 时 间 支 持 这 些 操作 

11.14 证 明 二 项 队列 实际 上 以 O(HD) 摊 还 时 间 支 持 合并 操作 : 定义 二 项 队列 的 位 势 为 树 的 

ROI ERAN AE, 
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第 12 章 高 级 数据 结构 及 其 实现 


我 们 在 这 一 章 讨 论 七 种 重点 在 王 实 用 的 数据 结构 。 首 先 考查 第 4 章 计 论 过 的 AVL 树 的 
变种 ,包括 优化 的 伸展 树 , 红 黑 树 ,( 在 前 面 第 10 章 讨 论 过 的 }) 跳 茎 表 的 确定 性 的 拱 式 ,AA- 树 ， 
以 及 treap 树 。 

然后 我 们 考查 一 种 可 以 用 于 多 维 数据 的 数据 结构 : 在 这 种 情况 下 ,每 一 项 均 可 有 若干 关 
EF. Ra 树 对 任何 关键 字 都 能 进行 相关 的 查找 . 

最 后 ,我 们 考查 配对 堆 {pairing heap) ,虽然 缺乏 分 析 结 果 AE EOF CE EHI SURE c SC 
MEA. 

复议 的 论题 包括 : 

。 在 适当 的 时 候 非 递 归 的 自 顶 加 下 (而 不是 从 底 癌 上 ) 的 查找 符 的 各 种 实现 六 法 - 

« 详细 ,优化 的 尤其 是 利用 标记 节点 的 实现 方法 。 


12.1 自 顶 向 下 伸展 树 


在 第 4 章 ,我 们 过 论 了 基本 的 伸展 峙 操作 ， 当 一 项 X 作为 一 片 树叶 被 插入 时 , 称 为 展开 
(splay}) 的 一 系列 树 的 旋转 使 得 X 成 为 树 的 新 的 根 。 展 开 操 作 也 在 查找 期 间 执 行 , 而 旦 如 未 一 
项 也 没有 找到 ,那么 就 要 对 访问 路 径 上 的 最 后 的 节点 施行 一 次 展开 。 在 第 11 章 , 我 们 指出 - 
次 展开 树 操作 的 摊 还 时 间 为 O(logN)。 

这 种 展开 操作 的 直接 实现 需要 从 根 沿 树 往 下 的 一 次 遍历 ,以 及 而 后 的 从 底 癌 上 的 一 次 遇 
历 。 这 或 者 可 以 通过 保存 一 些 父 指针 来 完成 ,或 者 通过 将 访问 路 算 存 储 到 ~ -个 栈 中 来 元 成 。 
但 遗憾 的 是 ,这 两 种 方法 均 需 太 量 的 开销 ,而 且 二 者 都 必须 处 理 许 多 特殊 的 情况 。 在 这 一 站， 
我 们 指出 如 何在 初始 访问 路 答 上 施行 一 些 旋 转 。 结 果 得 到 在 实践 中 更 快 的 过 程 ,只 用 到 0O{1) 
的 额外 空间 ARE T O Clog NO ERG TTA] A 

图 12-1 指出 单 旋 转 — RNS SIE. (FRR = BOUE PR HES. EVI 
问 的 任 一 时 刻 ,我 们 都 有 一 个 当前 节点 X, 它 是 其 子 树 的 根 ;在 我 们 的 图 中 它 被 表示 成 “中间 ” 
i Oot 上 把 节点 都 存放 在 小 于 X 的 树 了 中 ,但 不 在 X 的 子 树 中 ;类 极地 , 树 R 把 节 点 存在 大 
F 多 Fete ,但 不 在 X 的 子 树 中 。 初 始 时 X 为 工 的 根 ,而 志和 民 是 空 树 。 

如 果 旋 转 是 一 次 单 旋转 ,那么 根 在 Y 的 树 变 成 中 间 树 的 新 根 。XX 和 子 树 B 连接 而 成 为 R 
中 最 小 项 的 左 儿 子 ;XX MAILE LR NULL. 2885, X RAR 的 新 的 最 小 项 . 特别 要 
注意 ,为 使 单 旋转 情形 适用 ,Y 不 一 定 必须 是 一 片 树叶 。 如 果 我 们 查找 小 于 了 的 一 项 ,而 了 
没有 左 儿 子 { 但 确 有 一 个 右 儿 子 ) ,那么 这 种 单 旋转 情形 将 是 适用 的 。 


轨 ” 为 简单 起 见 , 我 们 不 区 分 一 个 “节点 "和 访 节 点 中 的 项 ， p 
Oo EEEH MEUS BER NULL AMA ,因为 没有 必要 。 这 意味 着 ,PrintTreet K T A oam , eee 88. T 
Af RF- 
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E121 自 顶 向 下 展开 旋转 : 单 旋转 .一 字形 旋转 及 之 字形 旋转 


对 于 一 字形 情形 .我们 有 类 似 的 剖析 : 关键 是 在 X 和 了 之 间 施 行 一 次 族 转 。 之 宁 形 情形 
的 旋转 把 底部 节点 Z 带 到 中 间 树 的 顶部 ,并 把 子 树 X 和 Y 分 别 附 接 到 R NL E. 注意 .了 
被 附 接 从 而 成 为 L 中 的 最 大 项 。 

之 字形 旋转 这 一 步 多 少 可 以 得 到 简化 ,因为 没有 旋转 要 执行 ,Z 不 再 是 中 间 树 的 根 ,Y 取 
而 代 之 ,如 图 12.2 所 示 。 因 为 之 字形 情形 的 动作 变 成 与 单 旋转 情形 相同 ,所 以 编程 得 到 简化 。 
看 起 来 这 是 有 利 的 ,因为 对 大 量 情形 的 测试 是 要 费时 的 。 其 缺点 是 ,仅仅 为 了 降低 一 层 ,我 们 
在 展开 过 程 中 却 要 进行 更 儿 的 选 代 。 


(3) D 
GR DEOR 
AN /A ES 


图 二 -2 简化 的 自 顶 向 下 的 之 字形 族 转 
图 12-3 指出 一 旦 执行 完 最 后 一 步 展 开 我 们 将 如 何 处 理工 ,R 和 中 间 树 以 形成 一 棵 树 。 特 


别 要 注意 ,这 里 的 结果 不 同 主 从 底部 向 上 的 展开 。 关 键 的 问题 在 于 这 里 你 持 了 O(logN ) 的 摊 
还 界 (练习 12.1)。 


(X) Qo 
A MEA LK 众 
AN AN 


图 12-3 ” 自 顶 向 下 展开 的 最 后 整理 
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Se 


PEP BARE PO oe 12-4 所 示 。 我 们 想 要 访问 树 中 的 19。 第 一 步 是 一 个 


之 字形 旋转 .根据 图 12-2( 的 对 称 形式 ) ,我 们 把 根 在 25 的 子 树 带 到 中 间 树 的 根 处 ,并 把 12 5I 
它 的 左 子 树 接 到 工 E. 


Empty Empty 





of Empty 
a 
9 Q3 
Q5 QU 
2) (20) 
(5) 15 G3 
(13) Qo 30) 
25) 
Q9 30) 


图 12-4 《访问 上 面 树 中 19) 自 项 向 下 展开 的 各 水 


下 一 步 是 一 个 一 字形 旋转 :15 被 提高 到 中 间 树 的 根 处 ,并 在 20 和 和 25 之 冰 进 行 一 次 旋转 ， 
所 得 到 的 子 树 被 连接 到 R 上 。 此 时 查找 19 导致 终止 单 旋转 ， 中 局 树 的 新 根 为 18, 而 15 WE 
的 堪 子 树 作 为 工 的 最 大 节点 的 右 攻 子 被 接 上 。 根 据 终 12-3 重新 组 装 则 结束 该 步 展开 。 


38 7 000000 $12* 


T4108 FERES ZEB et GR THE SRA BERRA. HFAA 
MAS. WERL PRP RAS BA RRA DR BK 13a IP IE 
以 使 得 程序 避免 检测 空 树 。 第 一 次 堪 树 变 成 非 空 叶 ， 右 指针 将 被 初始 化 并 在 以 后 保持 不 变 。 
这 样 ， 人 在 自 顶 向 下 得 找 的 最 后 ， 它 将 包 合 右 树 的 根 。 类 似 地 , APRA ES ER. 

图 12-5 所 示 的 过 程 Initialize 用 来 分 配 NuliNode 标记 。 我 们 合用 标记 NullNode 表示 - -个 
NULL 指针 。 我 们 将 反复 使 用 这 种 技术 来 简化 程序 (因而 使 得 程序 多 少 要 快 一 些 }。 图 12-6 
给 出 展开 过 程 的 程序 ,这 里 的 Header 节点 使 我 们 肯定 能 够 把 SIR 的 最 大 节点 上 而 不 必 
BÈR 可 能 是 空 的 {对 于 处 理 上 的 对 称 的 情形 类 位 地 进行 )。 


一 ”一 -一 


&ifndef _Splay_H 


struct SplayNode; 
typedef struct SplayNode *SplayTree; 


SplayTree MakeEmpty( SplayTree T 3; 

SplayTree Find( ElementType X, SplayTree T 3; 

SplayTree FindMin€ SplayTree T ); 

SplayTree FindMax( SplayTree T J; 

Splay]ree Initialize( void 5; 

SplayTree Insert EtementType X, SplayTree T ); 

SplayTree Remove( ETementType X, SplayTree T ); 
flementType Retrieve( SplayTree T 3; /* Gets root item */ 


endif /* Solay_H */ 


/* Place in the implementation file */ 
struct SplayNede 
{ 
ElementType Element, 
SplayTree Left; 
SplayTree Right; 
n 
typedef struct SplayNode "Position; 
static Position NullNode = NULL; /* Needs initialization */ 


SplayTree 
Initialize( void } 


ifi NullNode == NULL 2 
1 
Nu'lNode = malloc( sizeof( struct SplayNode ) 3; 
aft Nul!Node == NULL j 
FaralErrort "Out of space!!!" J; 
NullNode-»Left = NullNode-»Right = NullNode; 


return MullNode; 


图 12-5. ”伸展 树 :声明 和 初始 化 


正如 我 们 .上 面 提 到 的 ， 在 麻 开 末尾 重新 组 装 之 前 , Header. Left 和 Header. Right 分 别 指 着 
RR 和 上 (这 不 是 一 个 排 印 错误 一 一 苯 从 指针 的 指 问 )。 除了 这 个 细节 之 外 ,该 程序 是 祖 对 简 


"LIE 


/* Top-down splay procedure, */ 
/* not requiring Item to be in the tree */ 


SplayTree 
Splayt ElementType Item, Position X j 


static struct SplayNode Header; 
Position LeftTreeMax, RightTreeMin; 


Header.Left = Header.Right = NullNode; 
LeftTreeMax = RightTreeMin = &Header; 
NullhHode--Element = Item; 


while( Item l= X->Flement ) 
1 
ifi Item < X->Element } 
{ 
iff ftem < X->Left->Element } 
X = SingleRotatewithi eft( X 3; 
ifC X--Left == NullNode 3 
break; 
/* Link right */ 
RightTreeMin->Left = X; 
RightTreeMin = X; 
X = X-»left; 
] 


else 


if( Item > X-»Right--Element j) 
X = SingleRotateWithRight( X 5: 
if( X->Right == NullNode ) 
break; 
/* Link Left */ 
LeftTreeMax-»Right = X; 
LeftTreeMax = X; 
X = X->Right; 


} 
}  f* while Item !- X-»Element * y 


/* Reassemble */ 
LefrTreeMax-»Right = X-»Left, 
RightTreeMin->Left = X-»Right; 
X->Left = Header. Right; 
X--Right = Header.Left; 


return X; 





图 12.6 自 项 向 下 的 展开 计 程 


图 12-7 最 示 将 一 项 插入 到 树 T 中 的 过 程 。 一 个 新 的 指针 (如 果 需 要 ) 被 分 配 , 且 如 相 T 
是 空 的 ,那么 建立 一 棵 单 节点 树 。 否 则 ,我 们 围绕 ken RH T. 车 的 新 根 的 数据 等 于 
ltem, 则 我 们 有 一 个 复制 拷贝 ;我 们 不 是 再 次 搬入 Item, 而 是 为 将 来 的 插入 保留 NewNode 并 
立即 返回 。 如 果 T 的 新 根 包 含有 大 于 Bem 的 值 ,那么 T 的 新 根 和 它 的 右 子 树 变 成 New Node 
的 一 棵 右 子 树 ,而 T 的 左 子 树 则 成 为 NewNode BU AE TI 如 果 工 的 新 根 包 含有 小 于 Item HY 
值 , 那 么 类 似 的 逻辑 仍然 适用 。 在 这 两 种 情况 下 ,NewNode 均 成 为 新 的 根 。 


350 £123 





Splaylree 
Insert( ElementType Item, SplayTree T > 
i 


static Position MewNode = NULL: 


iff NewNċde == ULL ? 
| 
NewNade = mallac( sizeof( struct SplayNode ) 2; 
ift NewNode == NULL 3} 
FataltError(t "Out of space!!!" J; 
} 


NewNode->Element = Item; 


ifC T == NullNode } 
{ 
NewNode-»Left = NewNode->Right = NuilNede; 
T = NewNode; 
} 
else 
{ 
T = Splay¢ Item, T X; 
ift Item < T->Element ) 


i 
NewHode-»Left = T-»Left ; 
NewNode--Right = T; 
T-»ieft = NullNode; 
T = NewNode; 

} 

else 


if( T-»Element < Item ) 
f 
MewNode-»Right = T->Right; 
NewNode->Left = T; 
T-»Right = NullMode; 
T - NewNode; 
j 
else 
return T; /* Already in the tree */ 
t 


NewNode = NULL; /* So next insert wil! cal! mallac */ 
return T; 





412-7 自 项 向 下 伸展 树 的 搬入 


在 第 4 章 , 我 们 证 明了 伸展 树 中 的 删除 是 容易 的 ,因为 一 次 展开 将 把 删除 上 且 标 放 在 根 处 。 
最 后 我 们 指出 图 12-8 中 的 删除 例 程 。 删 除 过 程 比 对 应 的 插入 过 程 还 要 短 OCA 
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SplayTree 
Remove( ElementType Item, SplayTree T 3 
1 


Position New] ree 





iff T != NullNode ) 
| | 
T = 5play( Item, T ); 
if¢ Item == T--Element ) j 
| | 
/* Found it! */ 
if( T->Left == NullNode } 
NewTree = T->Right; 
else | 
i 
NewTree = T-»Left 
NewTree = Splay( Item, NewTree ); 
NewTree-»Right = T-»Right; 


i 
freagt T X; 
T = New Tree; 
H 
} 


return T: 


tj 





图 12-8 髓 项 向 下 的 删除 过程 


12.2 2 Se 


历史 上 AVL BHAT AO — EPHEL H (red black tree)。 对 红 黑 树 的 操作 在 最 坏 情形 
下 花费 O(logN) 时 间 , 而 且 我 们 将 看 到 ,( 对 于 插入 操作 的 ) 一 种 慎重 的 非 递归 实现 可 以 相对 
容易 地 完成 (与 AVL 树 相 比 )。 

红 黑 树 是 具有 下 列 着 色 性 质 的 二 义 查 找 树 : 

|. 每 一 个 节点 或 者 着 成 红色 ,或 者 着 成 黑色 。 

2. 根 是 黑色 的 。 

3. 如 果 一 个 节点 是 红色 的 ,那么 它 的 子 节点 必须 是 黑色 的 。 

4. 从 一 个 节点 到 一 个 NULL 指针 的 每 一 条 路 从 必须 包含 相同 数目 的 黑色 节点 。 

着 色 法 则 的 一 个 推论 是 , 红 黑 树 的 高 度 最 多 是 2log( N + 1)。 因 此 ,查找 保证 是 一 种 对 数 
的 操作 。 图 12-9 显示 一 棵 红 黑 树 ,其 中 的 红色 节点 用 双 贺 圈 表 示 。 


(30) 





图 12-9 oy BL IS LA FE 10,85. 15,70. 20,60 30,50, 65, 80,90,40,5,55) 
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和 通常 -- 样 ,困难 在 于 将 一 个 新 项 插 人 到 树 中 : 通常 把 新 项 作为 树叶 放 到 树 !P。 un 
(HES RBG WARE EERE AAR SHREK NEV HORE. A 
I. ik PR RET RE A PRAT AA SR RES ea REST 
色 的 ,那么 我 们 得 到 连续 红色 节点 ,这 就 违反 了 了 条件 3。 在 这 种 情况 下 ,我 们 必须 调整 该 树 以 
ARE 3 满足 { 且 叉 不 引起 条 件 4 被 破坏 )， 用 于 完成 这 项 什 务 的 基本 操作 是 颜色 的 改变 各 
树 的 旋转 . 

12.2.1 Bie EBA 

我 们 已经 提 到 ,如 果 新 插 人 的 项 的 父 节 点 是 黑色 的 ,那么 插入 完成 。 因此 ,将 25 LACE ES 
12-9 的 树 中 是 简单 的 操作 . 

如 果 父 节点 是 红色 的 ,那么 有 几 种 情形 (每 种 部 有 一 个 镜像 对 称 ) 需 要 考虑 。 首 先 , 假 设 这 
个 公 节 点 的 兄弟 是 黑 的 {我 们 采纳 约定 :NULL 节点 都 是 黑色 的 }，。 这 对 于 插入 3 8 是 通用 
的 ,但 对 搬入 99 不 适用 , 令 X 是 新 加 的 树叶 ,P 是 它 的 父 节点 ,S BART RRA 
在 ) ,是 祖父 节点 。 在 这 种 情形 只 有 四 和 PP 是 红 的 ,CG 呈 黑 的 ,因为 否则 就 会 在 插入 前 有 两 
个 相连 的 红色 节点 ,违反 六 红 黑 树 的 法 则 。 采 用 伸展 树 的 术语 , 关 ,P HG 可 以 形成 一 个 一 学 
形 链 或 之 字形 链 ( 两 个 方向 中 的 任 一 个 方向 }。 图 12-10 指出 当 PP 是 一 个 左 儿 子 时 (注意 有 一 
个 对 称 情形 ) ,我 们 如 何 旋 转 该 树 。 即 使 x 是 一 片 树叶 ,我 们 还 是 退出 更 一 般 的 情形 ,使 得 X 
在 树 的 中 间 。 后 面 我 们 将 用 到 这 个 更 一 般 的 旋转 。 





图 12-10 WE s 是 黑 的 , 则 单 旋 转 和 之 字形 旋转 有 效 


第 - .种 情形 对 应 P 和 G 之 闻 的 单 旋 转 ,而 第 二 种 情形 对 应 双 旋 转 , 该 双 旋 转 首先 厂 X 和 
P 问 进行 ,然后 在 祥和 之 问 进行 。 当 编写 程序 的 时 候 , 我 们 必须 记录 父 节 点 BLT 
及 为 了 重新 连接 还 要 记录 曾祖 节 上 总 - 

在 两 种 情形 下 , 子 树 的 新 根 均 被 涂 成 黑色 ,因此 ,即使 原来 的 曾祖 是 红 的 ,我 们 也 排除 A 
个 相 部 红 节点 的 可 能 性 .同样 重要 的 是 ,这 些 旋转 的 结果 是 通 问 A.B HIC 诸 路 径 工 的 墨 节 
点 个 数 保持 不 变 。 

到 现在 为 止 一 切 顺利 。 介 是 ,正如 我 们 企图 将 79 插入 到 图 12-9 树 中 的 情况 一 样 ,如 果 5 
中 红色 的 ,那么 会 发 生 什 么 情况 昵 ? 在 这 种 情况 F ,初始 时 从 子 树 的 根 到 C 的 路 答 上 有 一 个 
黑色 节点 。 在 旋转 之 后 ,一 定 仍然 还 是 只 有 一 个 黑色 节 感 。 但 在 两 种 情况 下 ,在 通 向 C 的 路 
径 上 部 有 三 个 节点 (新 的 根 ,G OUS). 由 于 只 有 一 个 可 能 是 墨 的 ,又 由 于 我 们 不 能 有 连续 的 红 
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色 节 点 ,于 是 我 们 必须 把 S 和子 树 的 新 根部 涂 成 红色 , 面 把 GOD ERU S STRING 
这 很 好 ,是 是 ,如 果 曾 祖 也 是 红色 的 那么 又 会 怎样 呢 ? 此 时 ,我 们 可 以 将 这 个 过 程 厚 着 根 的 方 
fi) E38 ,就 像 对 也 树 和 二 叉 堆 所 做 的 那样 , 直到 我 们 不 再 有 两 个 相连 的 红色 节点 或 者 到 达 根 
( 它 将 被 重新 涂 成 墨色) 处 为 赴 。 

12.2.2 BMA THIRA 

上 滤 的 实现 将 划 用 --- 个 栈 或 用 一些 父 指针 保存 路 径 。 我 们 看 到 ,如 采 我 们 使 用 一 个 乌 顶 
向 下 的 过 积 , 实 际 上 是 对 红 黑 树 应 用 从 项 向 下 保证 S 不 会 是 红 的 过 程 , 则 仲 展 树 会 于 有 效 。 

这 个 过 程 在 概念 上 是 容易 的 . 在 向 下 的 过 程 中 当 我 们 看 到 一 个 节点 X 有 两 个 红 儿 于 的 
时 候 ,我 们 让 X 成 为 红 的 而 让 它 的 两 个 儿子 是 黑 的 。 图 12- 11 显示 这 种 鼎 色 翻转 的 现象 , 儿 
fi x B AP 也 是 红 的 时 想 这 种 翻转 将 破坏 红 黑 的 法 则 。 租 是 此 时 我 们 可 以 应 用 图 
12.10 中 适当 的 旋转 。 如 果 X 的 父 节点 的 兄弟 是 红 的 会 如 何 ? RP TREC RM ii ob ct 
程 中 的 行动 所 排除 ,因此 X 的 父 节 点 的 兄弟 不 可 能 是 红 的 ! Jy Bo, An AR ACTES PRI 
中 我 们 看 到 一 个 节点 了 有 两 个 红 儿 子 ,那么 我 们 知道 Y 的 孙子 必然 是 扰 的 ,由 于 Y 的 儿 于 
也 要 变 成 黑 的 ,其 至 在 可 能 发 生 的 旋转 之 后 ,内 此 我 们 将 不 会 看 到 上 基层 上 另外 的 红 节 后。 这 
KE FRITS X UE X 的 父 节 点 是 红 的 , 则 访 的 父 节点 的 兄弟 不 可 能 也 是 红 的 。 





图 12.]1 颜色 翻转 :具有 当 X 的 父 节 点 是 红 的 时 候 我 们 才能 变 续 旋转 
例如 ,假设 我 们 要 将 45 插入 到 图 12-9 中 的 树 上 。 在 沿 树 向 下 的 过 程 中 ,我 们 看 到 50 有 
两 个 红包 子 。 因 此 ,我 们 执行 一 次 颜色 番 转 ,使 50 为 红 的 ,40 和 55 RAY. BOLE 50 和 60 $8 
是 红 的 。 我 们 在 60 和 70 之 间 执 行 单 旋转 ,使 得 60 是 30 的 右 子 树 的 黑 根 ,而 70 和 50 39 ET 
的 。 如 果 我 们 看 到 在 含有 了 黄 个 红 儿 子 的 路 径 上 有 另外 一 些 节 点 .那么 我 们 继续 ,执行 同样 的 操 
作 ， 当 我 们 到 达 树 叶 时 ,把 45 作为 红 节 点 揪 人 ,由 于 父 节点 是 黑 的 ,因此 插 人 完成 。 最 后 得 到 
Bg anb] 12-12 Aran. 






D 


(45) 


E1212 将 43 插 人 到 图 12-9 中 
如 图 12-12 所 示 ,所 得 到 的 红 黑 树 常 常平 衡 得 很 好 。 经 验 指 出 ,平均 红 黑 树 大 约 和 平均 
AVL 树 一 样 深 , 从 而 查找 时 间 一 般 接近 最 优 : 红 黑 树 的 优点 是 执行 插入 所 需 竖 的 开销 相对 较 
低 , 再 有 就 是 实践 中 发 生 的 旋转 相对 较 少 - 
红 时 树 的 具体 实现 是 复杂 的 ,这 不 仅 因为 有 大 量 可 能 的 旋转 ,而 且 还 因为 一 些 子 例 可 能 种 
空 的 {如 10 的 右 子 树 ) ,以 及 处 理 根 的 特 萄 的 情况 (尤其 是 根 没 有 父亲 )。 因此 ,我们 使 用 两 个 
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ETR: Pe AR, — Pat Null Node, ELS TE FH TE I E i PIHE Etam TP NULL 指 
针 。 根 标记 将 存储 关键 字 - oo - 1-8 Tu) ELIE HB HARTE. A, RATT Et ee CAT 
整 。 递 归 的 例 程 都 很 巧妙 。 我 们 使 用 一 个 隐藏 的 递归 过 程 , 而 并 不 强迫 用 户 传递 T— Right. 
因此 用 户 不 必 关 心 法 区 点。 图 12-13 指出 好 何 重 新 编 与 中 序 逮 历 . 






/* Print the tree, watch out for NuüllNode, */ 
/* and skip header */ 

















static void 
DoPrint( RedBlackTree T 7 
í 
if T != NullNode ) 
1 
DoPrint( T-»Left 3; 
Output( T-»Element ): 
DoPrint( T-»Right 3; 
} 


void 
PrintTreet RedBlackTree T ? 





DoPrint( T-»Right }; 
I 


图 12-13 (ERA PCM AP ae 


我 们 还 需要 使 用 户 调 用 例 程 Initialize 来 指定 涉 节 点 。 WRB RR, AS A Ini- 
tialize 应 该 再 为 NullNode 分 配 内 存 ( 其 后 的 树 可 以 分 享 NullNode). 这 和 类 型 声明 -起 如 图 
12-14 所 示 。 

接 下 来 ,图 12-15 显示 执行 一 次 单 旋 转 的 例 程 。 因 为 得 到 的 树 必 须 连 接 到 父 节点 上 ,所 以 
Rotate 抬 该 父 节 点 作为 一 个 参数 。 在 沿 着 树 下 行 的 时 候 ,我 们 把 Item 作为 参数 传递 ,而 不 是 
跟踪 旋转 的 类 型 。 由 于 我 们 希望 播 人 过程 中 旋转 很 少 ,因此 这 人 么 做 实际 上 不 仅 更 简单 ,而且 述 
ER, Rotate 直接 返回 执行 相应 单 旋转 的 结 采 。 

最 后 ,我 们 在 图 12-16 :pe5 he ASHE. HAE HandleReorient M6 7b £138 S1 A A Per JL 
千 的 节点 时 被 调用 ,在 我 们 搬入 一 片 树叶 时 它 也 被 调用 。 惟 一 复杂 的 部 分 尾 ， -个 双方 转 实 味 
上 是 两 个 单 旋转 ,而 且 只 有 当 通 向 X 的 分 支取 相反 方向 时 才 进 行 。 正如 我 们 在 较 早 的 讨论 中 
担 到 的 , 当 沿 树 向 下 进行 的 时 候 , Insert 必须 记录 父亲 ,祖父 和 曾祖 。 注意 ,在 一 次 旋转 之 后 ， 
存储 在 福 父 和 曾祖 中 的 值 将 不 再 正确 、 不 过 ,可 以 肯定 到 下 一 次 再 需要 它们 的 时 候 它 们 将 被 
重新 人 在 储 。 

12.2.3 自 顶 向 下 删除 

红 黑 树 中 的 删除 也 可 以 自 顶 向 下 进行 。 每 一 件 工 作 都 归结 于 能 够 删除 一 片 树叶 。 这 站 内 
为 ,要 删除 一 个 带 有 两 个 儿子 的 节点 ,我们 用 石子 树 |- 的 最 小 节点 代替 它 ; 该 节点 必然 最 多 有 
一 个 儿子 ,然后 将 该 节点 删除 。 只 有 一 个 右上 儿子 的 节点 可 以 用 相同 的 方式 删除 , 面 只 有 一 个 左 
儿子 的 节点 通过 用 其 左 子 树 上 最 大 节点 替换 ,然后 可 将 该 节点 删除 。 注意 ,对 于 红 黑 树 ,我 们 
使 用 的 方法 绕 过 带 有 一 个 儿子 的 节点 的 情形 ,因为 这 吕 能 在 树 的 中 部 连接 两 个 红色 节点 ,为 红 
黑 条 件 的 实现 增加 困难 。 
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typedef enum ColorTvpe { Red, Black } ColarType; 


struct RedBlackNode 

i 
Elementlype Element 
RedBlackiree Left; 
RedBlackTree Right; 
ColorType Color; 

H 


Position NullNode = NULL; /* Needs inittalization */ 


/* Initialization procedure */ 
RedBlackTree 
Tnitializet void 3 
{ 
RedBlackTree T; 


if€ NullNode = NULL ) 
{ 
NullNoade == mallect sizeoft struct RedBlackNode } 3; 
ifi NuliNode == NULL } 
Fatalkrror( "Out of space!!!" J; 
NullMode--Left = NullNode--Right = NullNode; 
NullNode-»Color = Black; 
NullNade-»£lement = Infinity; 
t 


/* Create the header node */ 
T = malloc{ sizeaf( struct Red&lackNode ) 3}; 
ifi T == NULL 3 

FatalError( "Out of space!!!" 5; 
T->Element = NegInfinity; 
T-»Left = T-»Right = NullNode; 
T-»Color - Biack; 


return T; 





图 12-14 ”类 型 声明 和 初始 化 













一 一 一 
/* Perform a rotation at node X */ 

/* (whose parent is passed as a parameter) * f 
/* The child is deduced by examining Item * f 


static Position l 
Rotate( ElementType Item, Position Parent ) 


rr 


if( Item < Parent->Element ) 
return Parent->Left = Item < Parent-»Left-»Elemenr ? 

SingleRotateWithLeft( Parent->Left ) : 
SingleRotateWithRight( Parent-»Left ); 

15e 

eS return Parent->Right = Item < Parent-»Right-»Element 7 
SingleRotatewithLeft( Parent->Right ) : 

SingleRotatewithRight( Parent-»Right ); 


图 12-15 旋转 过程 


Ea | KI2€ 


Static Position X, P, GP, GGP; 


static 
void HandleReorient( ElementType Item, RedBlackTree T > 
i 
X-»Color = Red; /* Do the color Flip */ 
X-»Left-»Color = Black; 
X->Right->Color = Black; 


ift P-»Color == Red ) /* Have to rotate */ 
{ 
GP-»Color = Red; 
if¢ {Item < GP->Element) t= (Item < P->Element) 3 
P = Rotate( Item, CP 3: /* Start double rotation */ 
X = Rotate( Item, GGF ); 
X-»Calor - Black; 


} 

T->Right->Color = Black; /* Make root black */ 
} 
RedBlackTree 


Insert( ElementType Item, RedBlackTree T > 
i 
X= P = GP = Ti 
NuliNode->Elament = Item; 
while( X-»Element != Item ) /* Descend down the tree */ 


GGP = GP: GP = P; P= X; 

ifr Item < X-»ETement } 
X = X-»Left; 

else 
X = X-»Right; 

if( X-»Left-»Color == Red && X->Right->Color == Red j 
HandleReorient( Item, T J; 

} 


ifC X |= NullNode 3 
return NullNode; /* Duplicate */ 


X a malloct sizeof( struct RedBlackNode ) ); 

iff X == NULL ) 
FatalError( "Out of space!!!" J; 

X-»El1ement = Item; 

X->Left = X-»Right = MullNode; 

if( Item < P->Element } /* Attach to its parent x f 
P-rLeft = X; 

eise 
P->Right = X; 

HandleReorient( Item, T J); /* Color red; maybe rotate + 


return T; 


Ej 12.16 MAHE 


当然 ,红色 树叶 的 删除 很 简单 。 然而 ,如 果 一 片 树叶 是 黑 的 ,那么 删除 操作 会 复杂 得 多 LER 
为 黑色 节点 的 删除 将 破坏 条 件 4。 解 决 方法 是 保证 从 上 到 下 删除 期 间 笛 叶 是 红 的 。 

在 整个 讨论 中 , 令 X 为 当前 节点 ,了 是 它 的 兄弟 ,而 PREM. 开始 时 我 们 把 树 
的 根 涂 成 红色 。 当 党 树 向 下 遍历 时 ,我 们 设法 保证 X 是 红色 的 。 当 我 们 到 过 一 个 新 的 节点 
时 ,我 们 要 确信 P 是 红 的 (归纳 地 按照 我 们 试图 保 桂 的 这 种 不 变性 ) 并 且 X 和 了 是 黑 的 (因为 
我 们 不 能 有 两 个 相连 的 红色 节点 )。 存 在 两 种 主要 的 情形 。 
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首先 , 设 X 有 两 个 黑 儿 子 。 此 时 有 三 种 子 情况 ,它们 由 图 12-17 所 示 。 如 果 丁 也 有 两 个 
黑 儿 子 ,那么 我 们 可 以 翻转 X. T Ni P 的 颜色 来 保持 这 种 不 变性 。 否 则 ,了 的 儿 于 之 : -是 红 
的 。 根据 这 个 儿子 节点 是 哪 一 个 ,= 我 们 可 以 应 用 图 12-17 所 示 的 第 二 和 第 三 种 情形 表示 的 旋 
转 。 特 别 要 注意 ,这 种 情形 对 于 树叶 将 是 适用 的 ,因为 NullNode 被 认为 是 黑 的 。 

设 不 的 儿子 之 一 是 红 的 。 在 这 种 情形 下 RSI EEA XT AP. WOR 
幸运 ,X 滥 在 红 儿 子 上 , 则 我 们 可 以 继续 向 前 进行 。 如 果 不 是 这 样 ,那么 我 们 知道 THE 
的 ,而 X MP 将 是 黑 的 。 我 们 可 以 旋转 TAP, RS X 的 新 父亲 是 红 的 ;当然 X 和 它 的 祖父 
将 是 黑 的 。 此 时 我 们 可 以 回 到 第 一 种 主 情况 。 





图 12.17 当 久 是 一 个 左 儿 子 并 有 两 个 辕 儿 子 的 三 种 情形 


12.3 ”确定 性 跳跃 表 


我 们 看 到 的 用 于 红 黑 树 的 一 些 想 法 可 以 应 用 到 跳跃 表 以 保证 对 数 最 坏 情 形 操作 。 在 这 一 
节 .我 们 描述 产生 数据 结构 的 最 简单 的 实 更 方法 1-2-3 A ETEK (deterministic skip list). 

回忆 第 10 音 讲 到 ,一 个 跳跃 表 中 的 节点 随机 指定 了 高 度 。 高 度 为 h 的 节点 包含 个 前 
向 指针 pp1, Prset Wip: 指向 高 度 为 i 或 更 大 的 下 一 个 节 忌 。 一 个 节点 具有 高 度 h A 
0.53( 为 了 实现 时 / 空 交换 ,0.5 可 以 用 0 和 1.0 之 间 的 任何 数 来 代 替 )。 因 此 ,我 们 期 望 只 处 
理 一 些 前 向 指针 直到 下 降 一 居 ; 由 于 有 大 约 logN Ja, 因此 我 们 得 到 每 次 操作 O ClogN ) 的 期 望 
运行 时 间 。 

为 使 这 个 界 成 为 最 坏 情 形 的 界 ,我们 需要 保证 只 有 常数 个 前 向 指针 需要 考查 直到 下 降 到 
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更 做 的 一 层 。 为 此 ,我 们 添加 一 个 平衡 条 件 。 首 先 需 要 两 个 定义 ， 

定 史 :两 个 元 素 称 为 是 链接 的 flinked) ,如 条 至 省 存在 一 个 指 和 守 从 一 个 元 素 指 问 为 -个 元 
素 。 

定 光 :两 个 在 高 度 为 链接 的 元 素 间 的 间 际 容量 (gap size) 等 于 它们 之 加 高 度 为 天 -1 的 
FUR IST 

1-2-3 MEHARRA I oc E BO PE Fc : — CRE AS ZI FT BE [8] Bt P) 89 A 
量 为 1.2 或 3。 例如 ,图 12-18 显示 一 个 上 2-3 MEHER. APITAR 3 HBT 
是 在 25 45 之 间 高 度 为 1 的 二 个 元 素 . 第 二 个 是 在 表 头 和 尾 之 问 商 度 为 2 的 三 个 元 素 。 尾 
PAS ©; EAH BL E T AAH EE X Xe? [8] BIO REUS: 88 9S 





图 12-18 ”一个 1-2-3 确定 性 跳跃 表 


显然 , 当 我 们 沿 任 一 层 行进 仅仅 通过 常数 个 指针 然后 就 可 下 降 到 低 一 层 . 因此 ,在 最 坏 的 
情形 下 查找 的 时 间 是 OtlogN )。 

为 了 执行 插入 ,我 们 必须 保证 当 一 个 高 度 为 的 新 节点 加 入 进来 时 不 会 产生 具有 四 个 高 
HJ A 的 节点 的 间 阶 。 实 际 上 这 很 简单 ,我 们 采用 类 似 于 在 红 黑 树 中 所 做 的 白 项 向 下 的 方法 
即 可 。 

设 我 们 在 第 工 层 上 ,并 正 要 降 到 下 一 层 去 。 如 果 我 们 要 降 到 的 间 承 容量 是 3, 堵 么 我 们 所 
高 该 间 辽 的 中 间 项 使 其 高 度 为 工 ,从 而 形成 丽 个 容量 为 1 的 间 院 。 由 于 这 使 得 朝向 删除 的 扎 
路 上 消除 了 容量 为 3 的 间隙, 因此 插入 是 安全 的 。 

例如 ,图 12-19 显示 项 27 到 图 12-18 的 确定 性 跳 蚂 表 中 的 插入 操作 。 在 关节 点 ,我 们 将 要 
从 第 3 层 降 到 第 2 层 。 由 于 下 降 将 落 入 到 容量 为 3 HHR, 因此 这 里 的 中 项 (25) 将 上 升 到 高 
gp 3 并 在 表 中 被 拼接 好 。 在 第 2 层 的 误 找 将 我 们 带 到 25 ,我们 需要 在 此 外 下降 到 第 1 层 。 在 
这 里 又 见 到 容量 为 3 的 间隙 ,因此 把 35 提升 到 高 度 2。 结 果 如 畴 12-20 Bras, SRA 27 的 时 
候 ,将 它 接 到 表 中 ,如 图 12-21 BAN. 





图 12.20 HA 27: 其 次 ,通过 提升 35 将 含 3 个 高 度 1 HT a BIS] B ot 
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12-21 A 27, 最 后 .将 27 VERSES 1 RS SRA 


删除 的 困难 出 现在 间 了 容量 为 1 的 情况 。 当 我 们 看 到 将 要 下 降 到 一 个 容量 为 1 Ag 
时 ,我 们 把 这 个 闻 辽 放大 :或 者 是 通过 从 相 邻 间隙 (如 果 容 量 不 为 1) 借 来 的 方式 ,或 者 通过 降 
(RE ROSARY ARERR. APRA ES | 的 间隙, 因此 结果 变 
成 窑 量 为 3 的 间隙 。 由 于 有 凡 种 情形 要 处 理 , 因 此 程序 比 我 们 的 描述 稍微 复 民 一些- 

整个 过 程 是 如 何 实现 的 呢 ? 在 描述 了 所 有 的 细节 之 后 ,我 们 将 看 到 程序 代码 的 量 实际 上 
是 相当 小 的 。 

第 一 个 重要 的 细节 是 , 当 我 们 将 一 个 高 的 节点 提升 到 高 h + 1 的 时 候 , 我 们 不 能 花费 时 
i] Ofa) 用 于 将 疡 个 指针 拷贝 到 一 个 新 数组 。 否 则 , 插 人 的 时 间 界 就 要 成 为 O(log NO T.: 
_. 种 合理 的 方法 是 用 一 个 链表 表示 高 度 为 的 节点 中 的 个 前 问 指针 。 由 于 我 们 是 沿 着 各 
层 向 下 行进 ,因此 一 个 节点 的 链表 是 以 第 h 层 前 向 指针 开始 并 以 第 1 层 前 向 指针 结束 。 

第 二 是 优化 更 复杂 而 且 可 能 占用 一 些 空间 。 我 们 不 是 把 节点 作为 一 项 和 前 向 指针 的 链表 
来 存储, 而 是 存储 前 商 指针 和 前 向 项 对 的 链表 。 理解 其 含义 的 最 容易 的 方法 是 参考 图 12-22, 
ERR 12-21 的 另 一 种 表示 方法 。 我 们 将 使 用 术语 独 象 表示 或 远 辑 表示 来 描述 图 12-21 并 把 
图 12-22 当 作 是 (实际 的 ) 实 现 方 法 。 





首先 注意 ,除了 尾 节点 被 删除 外 ,抽象 表示 和 实际 实现 二 者 的 地 平 线 (skyline 一 即 我 们 
拓 左 到 右 扫描 的 高 度 ) 是 一 样 的 。 在 我 们 的 实现 中 ,每 “个 节点 都 留 有 使 我 们 下 降 一 层 的 指 
针 指向 同 层 上 的 下 -一 个 节点 的 指针 以 及 还 辑 上 存储 在 下 一 项 中 的 项 (如 原始 抽象 描述 所 壕 ) 

注意 .有些 项 的 出 现 是 多 于 一 次 的 ;例如 ,25 出 现在 三 个 地 方 。 事 实 上 ,如 果 一 个 方太 在 
抽象 表示 中 的 高 度 为 及 ,那么 它 的 项 在 实际 实现 中 就 会 出 现在 h 个 地 方 。 ARR SE 
和 惊人 的 结果 我 们 将 在 给 出 实现 方法 后 进行 解释 。 

千本 节点 由 一 个 关键 字 和 两 个 指针 组 成 。 为 了 使 编程 更 快 更 简单 ,我 们 使 用 了 一 个 尾 
点 :如 果 不 能 够 或 不 希望 赋值 ,那么 就 必须 用 到 别 的 技巧 。 我 们 对 头 节点 和 底层 节点 都 有 一 
个 标记 以 代 圭 NULL 指针 。 声 明和 初始 化 的 例 程 如 图 12-23 所 不， 

各 找 函数 与 随机 化 跳跃 长 的 相同 。 图 12-24 指出 ， 如 果 我 们 得 不 到 匹配 的 项 ,那么 或 者 问 
下 进行 ,或 者 向 右 进 行 ,这 依赖 于 比较 的 结果 。 如 图 12-25 所 示 , 插 人 操作 由 于 标记 的 引入 而 
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天 天 地 得 到 简化 。 利 用 某 些 烦 瑛 的 指针 跟踪 我 们 可 以 看 到 ,如 果 不 得 不 对 每 一 个 指针 是 否 是 
NULL 进行 测试 ,那么 我 们 就 会 很 容易 地 将 程序 代码 增加 三 倍 。 

图 12-25 指出 ,确定 性 跳 唉 表 插 入 过 程 的 程 摩 多 多 少 少 短 一 些 , 考 虑 的 情况 比 红 黑 树 少 得 
多 。 我 们 所 付出 的 代价 似乎 是 空间 :在 最 坏人 情况 下 我 们 有 2N 个 节点 ,每 个 半点 包含 两 个 指针 
和 一 项 。 对 于 红 黑 树 ,我 们 有 N 个 节点 ,每 个 节点 包 售 师 个 指针 .一 项 以 及 一 个 颜色 位 (bit)。 
因此 ,我 们 可 能 要 用 到 两 倍 多 的 空间 。 可 是 ,事情 没有 糟 到 这 一 步 。 首 先 , 经 验 指 出 ,多 定 性 跳 
版 表 平 均 使 用 大 约 1.57N PUA. Fk, ERAS Ae TEBEEK SE Bn fis A tal 
£7 

这 里 有 一 个 实际 的 例子 。 在 32 位 机 上 ,指针 和 整数 是 4 个 字 节 。 对 于 其 些 系 统 ,包括 某 
些 版 本 的 UNIX, 内 存 是 按 块 (chunk) 来 配置 的 ,它们 通常 是 2 的 宪 , 但 存储 管理 程序 使 用 4 个 
字 节 的 块 。 于 是 ,对 于 12 个 字 节 的 请 求 将 得 到 一 个 16 字 节 块 ;12 个 字 节 由 用 户 使 用 而 4 个 
字 节 作为 系统 开销 。 但 是 ,对 于 13 个 字 节 的 需求 则 必须 提供 一 个 32 SE DER. A aR 
帝 下 ,确定 性 跳跃 表 每 个 节点 使 用 16 个 字 节 ,而 平均 有 1.57N 个 节点 , 邦 总 数 一 般 约 为 25N 
个 字 节 。 可 是 , 红 黑 树 却 使 用 32N 个 字 节 1 这 说 明 在 某 些 机 器 上 一 个 附加 位 (bib 是 非 章 名贵 

470| “的 ;这 是 自 组 织 结构 的 吸引 力 之 一 。 


struct SkipNode 
f 


ElementType Element; 
Skiplist Right; 
SkipList Down: 


m 
static Position Bottom = NULL: /* Needs initialization */ 
Static Position Tail e NULL: /* Needs initialization * / 


/* Initialization procedure */ 


Skiprtist 
Initial!ze( void ) 
| 

SkipList L; 


ift Bottom == NULL } 
{ 


Bottom = malloc sizeof( struct SkipNode ) }; 
if( Bottom == NULL ) 

FatalError( "Out of space!!!" ); 
Bottom-»Right = Bottom-»Down = Bottom; 


Tail = malloc( sizeof( struct SkipHode 5 J; 
if(C Tail == NULL > 
FatalError( "Out of space!!!" 5; 
Tail-»Element = infinity; 
Tail-»Right = Tail; 
} 


/* Create the header node */ 
L = malloc( sizeof( struct SkipNode ) ); 
ifC L == NULL > 

FatalError( "Out of space!!!" 9; 
L->Element = infinity; 
L->Right = Tail; 
L->Down = Bottom, 


return L; 


873] 图 12.23， 确 定性 跳 腾 表 ;类 型 和 初始 化 ( 均 不 在 头 文件 中 ) 


————— 
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/* Return position of node contatning item, */ 
/* or Bottom if not found */ 


Position 
Find FlementType Trem, SkipList L 3 
| 


Bottom--Element = Item; 
while€ Item != Current->Element } 
ifi Item < Current->Element ? 
Current = Current--Down; 
eise 
Current = Current »Right; 


Position Current = |: 


return Current; 


Hi 1224 mETEBEB E: Find 例 程 
















SkinList 
Insert( ElementType Item, SkipList L 2 
{ 

Pasition Current = L; 

Position NewNode; 









Bottom->Element = Item; 
while( Current !- Bottom ) 
i 

while( Item > Current->Element ) 
Current - Current--Right; 
























/* If gap size is 3 or at bottom level */ 

/* and must insert, then promote the middle element */ 

if( Current-»Element > 
Current-»Down-»Right-»Right--Element 3 

1 


NewNode = malloc( sizeof( struct SkipNode ) ): 
if( NewNode == NULL j 
Fatal£rror( "Out of space!!!" J; 
NewNode-»Right = Current->Right; 
NewNode->Down = Current-»Down-»Right-»Right; 
Current-»Right = Mewhode: 
Newhodeg-»Elesent = Current-»Eiement; 
Current->Element = Current-»Down-»Right-»Element; 
} 
else 
Current = Current-»Down; 





/* Raise heighr of DSL if necessary * 
ift t-»Right != Tail > 
NewNode = malloc( sizeof( struct SkipNode Yj; 
ift NewNode == NULL > 

FatalErrort "Qut of space!!!" Ji 
NewNode->Down = Li; 
NewNode->Right = Tail; 
NewNode->Element = Infinity: 
L = NewNode; 


| 


return L; 


图 12-25 Wü EFEDEEKOE 18 A LEE 
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确定 性 就 妈 表 的 性 能 似乎 比 红 黑 笃 要 强 。 当 寻找 播 入 时 间 的 改进 时 ,下 面 这 行 代码 : 
if(Current -> Element > Current -> Down —> Right — Right -> Element) 


(Rig m RH HE eer FF dk SP SA P ,那么 对 于 第 三 项 的 访问 可 以 直接 进 
行 ,而 不 用 再 通过 两 个 Right 指针。 图 12-26 表示 的 是 所 得 到 的 结构 ,这 个 结构 很 像 第 4 章 讨 
沦 前 马 树 。 我 们 称 之 为 1-2-3 WA E TEBE ERR AY k -P 4x 28 X XX (horizontal array implementa- 
tion)。 正 如 存在 链表 形式 和 水 平 数组 形式 的 高 阶 BB 树 一 样 ,我 们 也 有 这 两 种 形式 的 高 阶 确定 
性 跳 路 表 。 哪 种 方法 最 好 还 有 得 研究 ,可 能 紧密 依赖 于 特定 的 系统 和 应 用 . 


ic 


Tal : IT 
E1226 158 1222 的 水 平 数组 实现 
12.4 AA- 树 


因为 大 量 可 能 的 旋转 , 红 里 树 的 编程 相当 复杂 ,特别 是 删除 操作 。 确 定性 点 获 表 的 编 往 里 
在 一 定 程度 上 要 少 一 些 ,但 仍然 是 相当 复杂 的 ,这 由 所 需 的 三 个 标记 可 以 看 出 。 当 然 ,确定 性 
踏 蚂 表 中 的 删除 是 一 项 非 平凡 的 工作 。 在 这 一 节 , 我 们 描述 二 叉 B- 树 (binary B-tree) 一 种 简单 
但 却 颇具 竞争 力 的 实现 方法 ,这 种 树 叫 做 BB- 树 。BB- 树 是 带 有 一 个 附加 条 件 的 红 黑 树 :一 个 
节点 最 多 可 以 有 一 个 红 儿 子 。 为 使 编程 容易 ,我 们 采纳 一 些 法 则 。 
1. 首先 ,我 们 加 入 只 有 右 刀 子 可 以 是 红 的 的 条 件 , 这 就 消除 了 约 一 半 的 可 能 重新 构建 的 
"HUE. 它 也 消除 在 删除 算法 中 一 个 恼人 的 情形 :如 果 一 个 内 部 节点 只 有 一 个 儿子 , 那 
么 这 个 儿子 一 定 是 右 儿子 ( 它 刚 好 是 红色 的 )， Gp JL Mee x EUR ed 
4, Bi ,我 们 总 可 以 用 一 个 内 部 节点 的 右 子 树 中 的 最 小 节点 代替 该 内 部 节点 。 
2. 我 们 递归 地 编写 这 些 过 程 。 
3. 我 们 把 信息 存在 一 个 短 整 (short) 型 数 ( 例 如 8 个 比特 ) 中 ,而 不 是 把 一 个 颜色 位 (bit) 和 和 
每 个 节点 一 起 存储 。 这 个 信息 就 是 节点 的 层次 (level)。 节 点 的 层次 
JE 是 1, 若 该 节点 是 树叶 。 
« 是 它 的 父 节点 的 层次 , 若 该 节点 是 红 的 。 


S $b, Bae wae 
Current —» Element = = Current — Down — Right ~> Right -> Right -> Element 


对 其 些 系统 多 花费 200 mE! 
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如 此 得 到 的 结果 是 一 棵 AA- 树 。 图 12-27 显示 用 于 AA- 树 的 甘 型 志明。 我 们 再 一 次 使 用 
标记 来 代表 NULL, 

旭 果 我 们 将 AA 结构 要 求 从 颜色 转换 成 层次 ,那么 我 们 看 到 ALE ORE BT dn 
好 低 一 个 层次 ,而 右 儿 子 可 能 比 父 节点 低 人 0 或 1 个 层次 (但 不 会 再 多 )， 

水 平 链 接 {horizontal link) 是 一 个 节点 与 同 层 次 上 的 儿子 之 间 的 连接 。 这 种 结构 需求 使 得 
水 平 链接 是 向 右 的 指针 ,并 且 不 能 有 了 两 个 连续 的 水 平 链接 。 图 12-28 显示 一 棵 AN- 树 的 示例 。 
查找 使 用 通常 的 算法 完成 。 一 个 新 项 的 播 人 总 是 在 底层 进行 。 不 过 .有 两 个 问题 产生 :2 BW 
人 将 产生 一 个 左 永 平 链接 ,而 45 的 禁 人 将 产生 两 个 连续 的 右 水 平 链接 。 


/* Returned for failures */ 
Position NuliNode = NULL; /* Needs more initialization */ 


struct AANOdg 


Element?ype Element; 
AATree Left; 


AATree Right; 
int Level; 
H 
AATree 


Initialize void ) 


| 
| 
| 
if( NullNode == NULL ) 
Mullhode = malloc sizeof( struct AANode 》 5); 
if( NullNode == NULL ) 

FatalErrori "Out of space!!!" 5: 
NullNode-»Left = NullNbde-»Right = NullNode; 
NullMode--Level = 0; | 


} 
return NuliNode; 





图 12-27 AA- 树 ; 某 些 类 型 声明 及 初始 化 


| 
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E] 12-28 插入 10.85,15,70.20,60,30.50,65,80,90,40,5,55,35 732) pu — BE AAR 


在 这 两 种 情况 下 一 次 单 旋转 都 可 以 使 问题 得 到 解决 :通过 右 旋 转 消 除 左 水 平 链接 ,通过 左 
旋转 消除 连续 的 右 水 平 链接 。 这 些 过 程 分 别 叫 做 Skew 和 Split. Al 12-20 是 这 些 原 语 的 代 
码 ， 一 次 Skew 除去 一 个 左 水 平 链接 ,但 可 能 会 创建 连续 的 右 水 平 链接 , 因此 我 们 首先 执行 
Skew ,然后 再 Solit。 在 一 次 Split 之 后 ,中 间 节 点 R 的 层次 增加 。 由 于 新 建 一 个 左 水 平 节 反 或 
连续 的 右 水 平 节 点 ,因而 引起 X 的 原来 父 节 点 的 一 些 问 题 ,这 两 个 问题 都 可 以 通过 上 滤 
Skew/Split 的 方法 解决 。 如 果 我 们 使 用 递归 算法 ,那么 这 可 以 自动 地 完成 、 图 12-30 描述 了 
这 两 个 过 程 。 

将 45 $8 ASN 12-28 中 的 AA- 树 的 动作 在 图 12-31 到 图 12-35 PRA. 此 时 的 所 入 过 程 
只 比 非 平衡 实现 多 商行 ,如 图 12-36 BAK 
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当然 ,删除 操作 是 更 复杂 的 ,不 过 ,由 于 我 们 除去 了 许多 的 特殊 情况 ,程序 代码 实际 上 是 相当 
合理 的 。 表 先 ,我 们 记得 ,如 果 一 个 节点 不 是 树叶 ,那么 它 必 然 有 一 个 石 几 了 手 , 这 意味 者 , 当 删 除 
一 个 节点 的 时 候 , 我 们 总 可 以 用 其 右 子 树 上 最 小 的 儿子 代 蔡 这 个 节 扣 ,这 保证 它 是 在 第 一 层 上 ， 





f* If T's left child is on the same level as T, */ 
/* perform a rotation */ 


AATree 
5kew( AATree T 3 
1 
ifi T->Left->Level == T->Level ) 
T = SingteRotatewithLeft¢ T 3; 
return T: 


} 


/* If T's rightmost grandchild is on the same level, 
/* rotate right child up */ 


AATraa 
Split( AATree T ) 
! 


if( T->Right->Right->Level == T->Level ) 
f 


T = SingleRetatewithRight( T 5; 
T->Leyel++; 


return T; 


图 12-29 AA-Bihi Skew 过 程 和 Split 过 程 


一 人 一 一 Q0 P 
(Right Rotation) AN AN Vian 
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B]1231 在 将 45 播 人 到 示例 树 中 以 后 





图 12.32 TE 35 übxEfT Split 之 后 
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图 12-35 在 Skew70 和 Spiic30 后 最 后 得 到 的 树 


Inserti ElementType Item, AATree T > 


ift T == NulTNode 3 
{ 
/* Create and return a one-node tree */ 
T = maliloc( sizeof struct AANode ) J; 
If( T -- NULL ) 
FatalError( "Out of space!!!" 3; 
else 


T-»Element = Item; T->Level = 1; 
T-»Left = T-»Right = NulTNodge; 


return T; 
i 
else 
ifC Item < T->Element ) 
T-»Left = Insert Item, T->ieft 3; 
else 
if( Item > T->€lement ) 
T->Right = Insert( Item, T->Right 2; 


/* Otherwise it's a duplicate; do nothing */ 


T = Split( T 2; 
return T; 





图 12-36 AA- 树 ;搬入 过 程 


为 了 有 助 于 解决 问题 ,我 们 使 用 了 两 个 static 型 的 局 部 变量 DeletePtr 和 LastPtr。 因 为 
Remove 是 递归 过 程 ,所 以 这 两 个 变量 必须 是 static Mo 当 我 们 遍历 一 个 右 指 针 时 ,我 们 调整 
Teleteptr ,因为 我 们 递归 地 调用 Remove 直到 到 达 底 部 为 下 (在 沿 树 下 行 的 过 程 中 我 们 不 对 相 


等 进行 测试 ) ,这 保证 如 果 要 删除 的 项 在 树 了 上 ,那么 DeletePtr 将 指 问 包 含 它 的 节点 .LastPtr 
FRIAR eA, ACR TR AAA RS BL Pree RR EL ABA LastPtr 
EZRA Wee Spee TS ex, AURA Z PR. 

BIA BE RARAGA CIE 将 第 LIEU ATIS n BUA ET A LAARIN foe ES 
BR LAG 


ERAAI 点 的 层次 被 EE 
HAD A rodent 
s. 4 T RMA AL. WARIS T 
的 


个 儿子 的 层次 (实际 上 只 有 一 个 由 递 po WEM SUE CUR 
妥 油 用 所 输入 的 儿子 可 能 受 影 响 ,但 为 简 ee e BE RARE 
单 起 见 我 们 不 跟踪 它 ) 噬 低 到 比 THER EE Stee BE LURLR 
完成 ,调用 两 次 Split 除去 连续 的 水 下 链接 

低 2 ,那么 工 的 晨 次 也 需要 降低 。 此 外 ,如 
E 十 有 -个 右 红 儿 子 ,那么 的 右 儿 子 也 必须 将 它 的 层次 降低 。 此 时 ,我 们 可 能 在 同一 层次 
上 有 6 个 节点 ;本 ,的 右 红 儿 子 尺 ,R 的 两 个 儿子 ,以 及 这 些 儿子 的 右 红 儿 子 。 图 12.37 表达 
了 最 简单 的 可 能 情况 。 

在 节点 1 删除 以 后 ,节点 2 从 而 节点 5 变 成 了 层次 为 1 的 节点 。 首 先 ,我 们 必须 调整 在 他 
点 5 和 3 之 间 引 人 的 左 水 平 链接 。 这 基本 上 需要 两 次 旋转 (一 次 是 在 节点 5 和 3 之 问 , 而 后 是 
在 节点 5 和 4 之 间 )。 在 这 种 情况 下 不 涉及 当前 节点 下 。 另 一 方面 ,如 果 骨 除 来 自 右边 ,那么 
T 的 左 节点 可 能 忽然 之 间 就 可 能 变 成 水 平 的 了 ;这 也 需要 一 次 类 似 的 双 旋 转 (在 了 开始 )。 为 
T BHO BUE BORED. ,我们 只 要 调用 三 次 Skew 即 可 。- 一 旦 调用 完成 , 则 再 调用 两 次 Split 
就 足以 重新 安排 这 些 水 平 的 边 。 整 个 删除 例 程 如 图 1238 所 示 。 从 各 方面 来 看 ,这 对 编程 来 
说 都 是 想 对 简单 的 数据 结构 。 


AATree 
Remove( ElementType Item, AATree T ) 
1 
static Position DeletePtr, LastPtr; 


ift T !'- Null!Node > 
i 


/* Step 1: Search down tree */ 


Phu set LastPtr and DeletePtr */ 
LastPtr - T; 
if( Item < T->Element } 

T->Left = Remove( Item, T-»Left 3; 
else 


DeletePtr = 1; 
T-»Right = Remove( Item, T->Right ); 
} 





图 12-38 ”AA- 树 :删除 过 程 


co 这 个 按 巧 叮 以 用 于 Find 过 程 ,用 每 个 节点 的 两 路 比较 代 赫 在 每 个 节点 所 艇 的 三 路 比较 ,外 加 在 席 部 进行 的 儿 导 性 
Bi. 
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/* Step 2; If at the bottom of the tree and */ 
/* jtem is present, we remove it */ 
iff T == LastPtr } 

















ift DeletePtr !- NullNode ££ 
Item == DeletePtr-»Element ò 


DeletePtr->Element = T->Element; 
DeletePtr = NullNode; 
T = T-sRight; 


| 
| 
free( LastPtr 3; 


/* Step 3: Otherwise, we are not at the bottom; "/ 
* rebalance */ 


iff T->Left->Level < T->Level - 1 || 
T-»Right-»Level < T-»Level - 1 3 


ift T-»Right-»Level > --T-»Level ) 
T->Right->Level = T »Level; 

T = Skewl T 4; 
T-»Riüht = Skewt T-»Right 5; 
T-»Right--Right = Skew( T->Right->Right Ji 
T = 5plit( T jJ; 
T-»Right = Split( T-»Right 3; 

I 


return T; 


图 12-38(2€) AAA- 树 :删除 过 程 


12.5 treap fj 


最 后 一 种 二 叉 查 找 树 可 能 是 最 简单 的 一 种 ,叫做 reap 树 。 它 像 跳 跃 表 一 样 使 用 随机 数 并 
且 对 任意 的 输 人 都 能 给 出 O(logN ) 的 期 望 时 间 的 性 能 。 查找 时 间 等 同 于 非 平衡 二 叉 查 找 树 
(从 而 比 平衡 查找 树 要 慢 ) ,而 插 人 时 间 只 比 递 归 非 平衡 二 又 查找 树 的 实现 方法 稍 慢 。 旦 然 删 
除 操作 要 悍 得 多 ,但 仍然 是 O(logN AERE. 

teap 树 是 如 此 地 简单 ,以 致 我 们 不 用 画图 就 可 描述 它 . 树 中 的 每 个 节点 存储 -项 ,一 个 
无 利 右 指针 ,以 及 一 个 优先 级 ,该 优先 级 是 建立 节点 时 自动 指定 的 。 一 个 treap 树 就 是 一 柠 二 
VERA ,但 其 节点 优先 级 满足 堆 序 性 质 : 任 意 节 点 的 优先 级 必须 至 少 和 此 父亲 的 优先 级 一 
样 大 。 

其 每 项 都 有 不 同 优先 级 的 不 同 项 的 集合 只 能 由 一 个 treap 树 表 示 。 这 很 容易 由 归纳 法 
推导 ,因为 具有 最 低 优 先 级 的 节点 必然 是 根 。 H, HERRERA NI 种 可 能 的 排列 面 
不 是 根据 项 的 N! 种 排序 形成 的 。 类 型 声明 很 简单 ,只 要 求 Priority 域 的 加 法 。 标 记 NullN- 
ode 的 优先 级 为 co ,如 图 12-39 Bros o | 

£l] treap 树 的 插入 井 作 也 简单 :在 一 项 作为 树 时 如 人 之 后 .我 们 将 它 沙 着 该 treap Mia] ERE 
转 吉 到 它 的 优先 级 满足 堆 序 为 止 。 可 以 证 明 旋转 的 期 望 次 数 小 于 2。 在 要 被 删除 的 项 找到 以 
后 ,通过 把 它 的 优先 级 增加 到 oo 并 沿 着 低 优先 级 诸 儿 子 的 路 径 向 下 旋转 而 可 将 其 删除 。 一 旦 
它 是 树叶 ,就 可 以 把 它 除 去 。 图 12-40 和 图 12-41 中 的 环 程 利用 递归 实现 这 些 方法 .一 种 非 
递归 的 实现 方法 留 给 读者 去 练习 (练习 12.17). 对 干 删除 ,注意 当 节 点 逻辑 上 是 笃 叶 时 , 它 仍 


tb 


然 有 NullNode EA EZ ALF AGILE. 因此 , 它 与 右 儿 子 旋转 ,在 旋转 后 , 工 为 NullNode, 
后 右 包 子 可 以 被 释放 ， 还 旧 注 意 我 们 的 实现 是 假设 设 有 重复 汇 ; 如 果 这 个 仍 卉 不 成 立 ,那么 
Remove HRE RIR, (Ata?) 


Treap 
Imtialize( void ) 
1 


1fC NullMade zz KULI. } 
! 


NullNode = mallac( sizeof€ struct TreapNade } J; 
ifC Sul Node == NULL 5 
FatalError( “Out of space!!!" J; 
NuliMode--Left = Nut lNode->Right = NullNede; 
NullWoede->Priority = Infinity; 
} 
return NuliNode; 





图 12-39 treap E PI S8 dE 


Treap 
Insert( ElementType Item, Treap T » 


if( T == NullNode 3 
{ 
/? Create and return a one-node tree */ 
T = mallac€ sizeaf( struct TreapNode ) 5; 
jf( T == NULL ) 
FatalError( "Out of space!!!" ); 
else 
1 
T-»Element = Item; T-»Priority = Random( }: 
T »Left - T->Right = Nul]Node; 
1 
else 
if( Item < T-»Element } 
i 
T-»Left = Inserti Item, T-»Left ); 
ift T-»Left-»Priority < T-»Priority } 
T = SingleRetateWithLeft( T 3; 
} 
else 
if( Item > T-»Element ) 


T->Right = Insert( Item, T->Right ); 
if( T-»Right-»Priority < T->Priority ) 
T = SingleRotateWithRight¢ T 5; 
t 


/* Otherwise it's a duplicate; do nothing */ 


return T; 





图 12-40 treaps: fh ATA 


ireap 树 特 别 容易 实现 是 因 为 我 们 绝对 不 必 担 心 调整 优先 级 域 。 平衡 树 处 理 方法 的 图 难 
之 一 是 追查 由 于 未 能 更 新 一 次 操作 过 程 中 的 信息 而 导致 的 销 误 。 从 那些 合理 的 插 人 和 删除 程 
序 包 中 的 所 有 程序 行 来 看 ,treap H, 特别 是 以 非 递 归 方法 的 实现 ,似乎 才 是 不 费力 的 瓦 家 。 
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Treap 

Remove( ElementType Item, Treap T ) 
ift T != NuliNnde } 
{ 


if{ Item < T->Element ? 

T-»-Left = Remove( Item, T--Left 5^; 
else 
ifi Item > T->Element 3 

T->Right = Remove( Item, T-»Right j; 
else 


/* Match found */ 

ifi T-»Left-»Priority < T->Right--Priorizy ) 
T = SingleRotatewithLeft¢ T 3; 

else 
T = SingleRotatewithRight( T 3; 


if€ T != NudlNode ) /* Continue on down */ 
T = Remove( Item, T 3; 
else 
1 
/* At a leaf */ 
freet T->Left 5; | 
T-»Left = NullNode; 
| | 
] 


t 
return T; 





图 12-41 treaps: 删 除 过 程 


12.6 k-d 树 


设 一 广告 公司 拥有 一 个 数据 库 并 需要 为 某 些 客户 生成 邮寄 标签 。 典型 的 要 求 可 能 是 需 雪 
散发 邮件 给 那些 年 龄 在 34 到 49 之 间 且 年 收入 在 100 000 卖 元 和 150 000 美元 之 间 的 人 们 j: 
这 个 问题 叫做 二 维 范围 查询 (two-dimensional range query )c 在 一 维 情况 下 ,该 问题 可 以 借助 
二 简单 的 递归 算法 通过 遍历 预先 构造 的 二 叉 查 找 烦 以 OCM Y log N ) 平 均 时 间 解 决 。 这 里 ,M 
是 由 查询 所 报告 的 匹配 的 个 数 。 我 们 希望 对 二 维 或 更 高 维 的 情况 得 到 类 似 的 办 。 

一 维 查 找 树 具 有 简单 的 性 质 ; 在 奇数 层 上 的 分 支 按照 第 一 个 关键 字 进 行 , 而 在 偶数 层 上 的 
分 支 按 照 第 二 个 关键 字 进 行 。 根 是 任意 选取 的 奇数 层 ,图 12-42 XOR— BR 2-d 树 。 向 一 棵 2-a 
树 进 1 = 的 插入 操作 是 向 一 哥 二 叉 查 找 树 插 入 操 作 的 平凡 的 扩展 :在 沿 树 下 行 时 ,我 们 需要 保留 
当前 的 层 。 为 保持 程序 代码 简单 ,我 们 假设 基本 的 项 是 两 个 元 素 的 数组 。 此 时 我 们 需要 把 后 
限制 在 9 和 1 之 间 。 图 12-43 显示 的 是 执行 插 人 的 程序 。 在 这 一 节 我 们 使 用 说 归 ， 用 于 实践 
中 的 非 递归 实现 方法 是 简单 的 ,我 们 把 它 留 作 练 沪 12.23, 特别 是 由 于 若干 项 在 一 个 城中 可 
能 相同 ,因此 困难 之 一 是 重复 元 。 我 们 的 程序 允许 重复 元 , 且 总 是 把 它们 放 在 右 分 支 上 ,显然 ， 
如 果 有 太 多 的 重复 元 ,那么 这 可 能 就 是 一 个 问题 。 

稍 加 思索 便 可 确信 ,一 标 随 机 构造 的 2-4 树 与 一 覃 随机 二 叉 查 找 树 其 有 祖 同 的 结构 性 硕 : 
高 度 平均 为 O(logN) ,但 最 坏 情形 则 是 O(N)。 
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fl 12-42 2d 树 示 例 


static Kdfree 
Recursivelnsert( ItemType Item, KdTree T, int Level } 


ifC T == NULL ) 
{ 


T = malloc( sizeof( struct KdNede 3 J: 
af€ T == NULL > 
FatalError¢ "Out of space!!!" 3; 
T-»Left = T->Right = NULL; 
T-»Data( 0 ] = Item O ]; 
T->Dataf 1 1 = Item[ 1 !; 
} 


else 


if( Item{ Level ] < T-»Data[ tewel ] » 

T-»Left = Recursivelnsert( Item, T-»Left, !Level ); 
else 

T-»Righr = KRecursiveInsert( Item, Te>Right, !Level }; 
return T; 


j 

KdTree 

Insert ItemType Item, KdTree T j 
{ 


! 


return RerursiveInsert( Item, T, O 5; 





12-43. ”向 2-d 树 进 行 的 插入 


不 像 二 叉 查找 树 有 精巧 的 D(logN) 最 环 情形 的 变种 存在 ,没有 已 知 的 方案 能 够 保证 一 棵 
平衡 的 2-d 树 。 问 题 在 于 ,这 样 一 种 方案 很 可 能 基于 树 的 旋转 , 面 树 旋转 在 2-2 树 中 是 行 个 通 
By. 我 们 能 够 做 的 最 好 的 办 法 是 通过 重新 构造 子 树 来 定期 地 对 树 进 行 平衡 ,具体 撒 述 可 见 练 
习 。 类 似 好 ,也 不 存在 超越 明显 的 懒惰 删除 方法 的 删除 算法 。 如 果 在 器 要 处 理 查 询 之 前 所 有 
HA cL 9 5, AGAR SE SE BL OUNlogN) 时 间 构 造 一 棵 理想 平衡 2-4 树 , 这 就 是 练习 
12.21c. 

有 几 种 查询 可 以 在 2-4d 树 上 进行 。 我 们 可 以 要 求 精确 的 匹配 ,或 者 基于 两 个 关键 宇 中 一 
个 关键 字 的 匹配 ;后 者 称 为 部 分 匹配 查询 (partial match query) » 这 两 种 都 是 ( 正 交 ) 范 围 查 词 
(range query) 的 特殊 情形 。 

正 交 范围 查询 给 出 其 第 一 个 关键 字 在 一 个 特殊 的 信和 集合 之 河 且 第 二 个 关键 字 在 另 一 个 特 
殊 的 值 集合 之 闻 的 所 有 的 项 。 这 下 是 我 们 在 本 节 介 绍 中 所 描述 的 问题 。 如 图 12-44 所 示 , 范 
围 查 询 通过 一 次 递归 的 树 遍历 容易 解 出 。 通过 在 递归 调用 之 前 进行 测试 ,我 们 可 以 避免 对 所 
有 节点 的 不 必要 的 访问 。 
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/* Print items satisfying */ 
/* Lowl 0 ] <= Item! 0 ] <= High! à ] and */ 
/* Low[ 1 j «=+ Item[ 1 ] <= High[ 1 ] */ 


static void 
RecPrintRange( ItemType Low, ItemType High, 
KdTree T, int Level } 
I 
iff T !- NULL 2 
i 
ift Low[ O T «= T->Batal 0 ] && 
T->Patal © ] <= High[ 0 ] & 
Low! 1 ] «<= T-»Data[ 1 ] && 
T->DatalL 1 ] «- High[ 1] > 
PrintItemi T->Data 7; 


RecPrintRange€ Low, High, Ten. !Leyel ): 
if( High[ Level ] >= T->Data[ Level ] 3 
RecPrintRange(C Low, High, T-»Right, !Levei }; 
} 
t 


void 


ifC Low[ Level } <= T--Datal Level | 
PrintRange( ItemType Low, ItemType High, KdTree T } 
| 


RecPrintRange( Low, High, T, Ù 9; 


! 





图 12-44 2-d 树 ; 范 围 省 找 


为 找到 特定 的 项 ,我 们 可 以 令 Low MHigh 等 于 我 们 要 查找 的 项 。 为 了 执行 一 次 部 分 蓄 
丁 ' 查 询 . 我 们 计 在 这 次 匹配 中 涉及 不 到 的 关键 字 的 范围 为 ~ co 到 o。 其 余 范 围 设 置 为 低 点 和 
高 点 等 于 号 配 中 所 涉及 的 关键 字 的 值 。 

在 2-d 侍 中 插 人 或 精确 匹配 查找 化 费 的 时 间 平 均 正 比 于 树 的 深度 , 即 O(logN), MÆR 
坏 情形 下 为 O(N)。 一 次 范围 查找 的 运行 时 间 依 赖 于 如 何 将 树 平衡 ,是 否 要 求 部 分 匹配 ,以 
及 实际 上 有 多 少 项 被 找到 。 我 们 提出 三 个 结果 ,它们 已 经 得 到 证 明 。 

对 于 理想 平衡 树 , 一 次 范围 查询 要 报告 M 次 匹配 可 能 花费 最 坏 情形 时 间 O(M+v N)。 
在 任 一 节点 ,我 们 可 能 必须 访问 4 个 孙子 中 的 两 个 ,于 是 成 立方 程 了 T(N)=2T(N/4)+ 
OU) ,然而 在 实践 中 ,这 些 查找 趋向 于 非常 有效 ,其 至 最 坯 情形 都 不 是 那么 差 , 因 为 对 于 典型 
的 N TESNA logN zd aga gk dT K O 记 叶 中 的 更 小 的 常数 所 补 途 。 

对 于 随机 构造 的 树 . 部 分 匹配 查询 的 平均 运行 时 间 为 O(M+ NRP asit 
./ 仆 7) /2( 见 下 面 )。 最 近 的 多 少 令 人 震惊 的 结果 是 它 基 本 上 描述 了 随机 2-4 树 的 一 次 范围 查 
找 的 平均 运行 时 间 。 

RFT b 维 的 情况 ,同样 的 算法 仍然 成 立 ,我 们 通过 每 层 上 的 那些 关键 字 进 行 乱 环 。 T, 
在 实践 中 平衡 升 始 变 得 越 来 越 差 ,因为 重复 元 和 非 随机 答 入 的 影响 一 一 般 变 得 更 为 明显 。 我 们 
把 编程 的 细节 留 给 读者 作为 练习 而 只 叙述 解析 结 后 : 对 于 理想 平衡 树 ,一 次 范围 查询 的 最 坏 情 
形 运 行 时 间 为 O(OM + ANLI4)。 在 随机 构造 的 &d 树 中 ,涉及 个 关键 字 中 的 p 个 关键 字 
的 部 分 匹配 查询 花费 OU(M+ NT) F a 是 方程 

(2+a)’(tt+ a)? 52* 

(惟一 ) 的 正 根 。 对 各 种 p 和 ,a 的 计算 留 作 练习 ,类 =2 和 户 =1 的 值 反 映 在 上 面 对 于 随机 
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2-9 树 的 部 分 比 配 所 叙述 的 结果 中 . 
虽然 有 上 几 种 新 奇 的 结构 支持 范围 查找 ,但 是 bd 树 恕 怕 是 达到 可 接受 的 运行 时 间 的 最 简 

单 的 结构 了 . 

12.7 配对 堆 


我 们 考查 的 最 后 一 个 数据 结构 是 配对 堆 (pairing heap)。 配 对 堆 的 分 析 问 题 仍然 木 解决 ， 
不 过 , 当 需 DecreaseKey 操作 的 时 候 , 尼 似 平 胜 过 其 他 的 堆 结 枸 。 它 的 高 效率 的 最 可 能 的 不 
因 是 它 的 简单 性 。 配 对 唯 被 表 示 成 堆 序 树 。 图 12-45 显 炙 一 个 配对 堆 示 例 。 











图 12-45 cfl E: fü iE 


配对 堆 的 具体 实现 用 到 第 4 章 中 所 讨论 的 左 儿 子 . 右 兄弟 表示 方法 。 我 们 将 看 刘 , De- 
creaseKey 操作 要 求 每 个 节点 包含 -个 额外 的 指针 。 作 为 最 左上 儿子 的 节点 含有 “个 指 同 其 父 
亲 的 指针 ;和 否则 这 个 节点 就 是 一 个 右 兄 弟 并 含有 一 个 指向 它 的 左 兄 弟 的 指针 。 我 们 将 把 这 个 
域 叫做 Prev 域 。 为 了 简洁 ,我 们 省 去 类 型 声 明 , 这 些 类 型 声明 是 完全 直观 的 。 图 12-46 指出 
图 12-45 中 的 配对 堆 的 实际 表示 。 





图 12-46 ”前面 的 配对 堆 的 实际 表示 


我 们 以 概述 基本 操作 开始 。 为 了 合并 两 个 配对 堆 , 我 们 使 具有 较 大 根 的 堆 成 为 具有 和 较 小 
根 的 堆 的 左 几 子 。 当 然 , 插 入 是 合并 的 特殊 情形 。 为 执行 一 次 DecreaseK ey ,我 们 降低 所 需要 
的 节点 的 值 。 因 为 对 于 所 有 的 节点 都 不 保存 父 指针 ,所 以 我 们 不 知道 这 是 否 会 破坏 堆 序 。 如 
此 ,我 们 将 调整 后 的 节点 从 它 的 父 节点 切除 ,通过 合并 所 得 到 的 两 个 堆 而 完成 DecreaseKey 操 
作 。 为 了 执行 DeleteMin, 我 们 将 根除 去 ,得 到 堆 的 一 个 集合 。 WERA c 个 儿子 ,那么 对 合并 
过 程 进行 c -1 次 调用 将 该 堆 重建 。 这 里 ,最 重要 的 网 节 就 是 用 于 执行 合并 的 方法 以 及 如 何 应 
用 c -1 次 合并 。 

图 12-47 显示 和 如何 将 两 个 子 堆 合并 。 这 个 过 各 叮 被 推广 到 允许 第 二 个 子 堆 有 兄弟 的 情 
He 我 们 早先 提 到 过 ,可 以 让 具有 较 大 根 的 子 堆 成 为 男 一 个 子 堆 的 最 左 的 儿子 。 程序 很 简单 ， 
加 图 12-48 Aas. 注意 ,我 们 用 个 例子 ,在 这 些 例子 中 ,在 给 指针 贼 子 Prev 域 之 前 划 测 试 它 
是 否 是 NULL。 这 使 我 们 想到 ,有 一 个 NullNode 标记 或 许 是 有 用 的 , 它 忆 惯 上 放 在 这 一 章 的 
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图 12-47 Compare&ndLink 合并 两 个 子 堆 


This is the basic operation to maintain order */ 

Links First and Second together to satisfy heap order */ 
Returns the resulting tree */ 

First is assumed NOT NULL */ 

First-»NextSibling MUST be NULL on entry */ 


Position 
CompareAndLink( Position First, Position Second ) 
{ 
if( Second == NULL ) 
return First; 
else 
ift First->Element <= Second->Etement 7 
| 
/* Attach Second as the leftmost child of First */ 
Second-»Pray = First; 
First-»MextSibling = Second->NextSibling; 
ift First-»MextSibling != NULL ) 
First-»Next5ibling-»Prev = First; 
Second->Nextsibling = First-»LeftChild; 
if( Second->NextSibling !- NULL 3 
Second-»NextSibling-»Prev = Second; 
First-»LeftChild = Second; 
return First; 
j 
else 
{ 
/* Attach First as the leftmost child of Second */ 
Second->Prav = First-»Praewv; 
First->Prev = Second; 
First-»NextSibling = Second->Leftchi ld; 
if( First->NextSibling != NULL ) 
First-»MextSibling--Prev = First; 
Second-»LeftChild 2 First; 
return Second; 
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Insert 和 DecreaseKey 操作 是 抽象 描述 的 简单 实现 。DecreaseKey 需要 一 个 Position 对 象 。 
由 于 一 项 的 Position 在 它 第 一 次 插入 时 被 确定 (不 可 改变 ) ,因此 Insert 通过 第 三 个 参数 Loc 把 
Position 3 EIS RUE , Loc 由 参考 值 传递 。 程 序 如 图 12-49 所 示 。 如 果 新 的 关键 字 值 不 小 于 
老 的 ,那么 DecreaseKey 的 例 程 显示 警告 信息 。 在 这 种 情况 下 ,最 后 得 到 的 结构 可 能 不 遵守 堆 
序 . 基本 的 DeleteMin 过 各 由 抽象 描述 直接 得 到 ,如 图 12-50 所 未: 
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/* Insert Item into pairing heap H */ 

/* Return resulting pairing heap */ 

/* A pointer to the newly allocated node */ 
/* is passed back by reference and accessed as *Loc */ 




















PairHeap 
Insert ElementType Item, PairHeap H, Position *Loc ) 
1 

Position NewNode; 


NewNode = mallac€ sizeof( struct Pairhode ) J; 
1f( MewNode == NULL } 

FatalError( "Out of space!!!" J; 
MewMode-»Element = Item; 
NewNode-»LeftChild = NewNode->NextSibling = NULL; 
NewNode->Prey = NULL; 


"Loc x HewNode; 
if( H == NULL ) 
return NewNode; 
alse 
return CompareAndLink( H, NewNode 5; 


/* Lower item in Position P by Delta */ 


PairHeap 
DecreaseKey( Position P, ElementType Delta, PairHeap M } 
i 
ift Delta « Ùj 
Errori “Decreasekey called with negative Delta" 3; 


P-»Elament -= Delta; 
if( P == H } 
return H; 


ife P->NextSibling !z NULL ) 
P-»NextSibling-»Prev = P->Prev; 

iff P->Prey-sLaftChild == P } 
P_>Prev->LeftChild = P-»NextSibling: 

else 
P->Prev--NextSibling = P->NextSibling; 


P->NextSibling = NULL; 
return CompareAndLink( H, P ); 


图 12-49 BRP HE: Insert 和 DecreaseKey 


PairHeap 
DeleteMin( ElementType *MinItem, PairHeap H ) 


4 


Position NewRoot = NULL: 


if TsEmpty€ H } 3 . 
Error( “Pairing heap is empty!" ); 


else 
{ 


*MinItem = H->Element; 
if( H-»LeftChild (= NULL ) | 
NewRoot = CombineSiblings( H->LeftChiid 
free( H 2; 
t 


return Ne@wRoot; 





[E 12-50 We xT HE DeleteMin 
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当然 ,麻烦 在 于 一 些 骨 节 上 :CembineSiblings 如 何 实 现 ? 已 经 棍 出 几 种 变化 ,但 是 者 不 能 
证 明 它 们 能 够 提供 如 斐 波 那 契 堆 那 样 相同 的 摊 还 界 。 部 使 这 样 ,对 于 涉及 大 量 DecreaseKey 
操作 的 一 般 图 论 应 用 来 说 ,图 12-51 中 的 方法 似乎 总 基 和 和 其 他 堆 结 构 一 样 运 行 芯 至 比 它们 ( 包 
Th MOREA. 
























/* Assumes FirstSibling is NOT NULL */ 


PairHeap 
CombineSiblings¢ Position FirstS7bling ) 


int 1, j. NumSihlings; 


/* IF only one tree, return it */ 
ifi First&ibling-»NextSibling == NULL } 
return FirstSibl ing; 


| 

static Position TreeArray[{ MaxSiblings ]; 

/* Place each subtree in TreeArray */ 

for( NumSiblings = 0; FirstSibling != NULL; NumSiblings++ 2 

{ 
TreeArrav[ NumSiblings ] = fFirstSibling; 
Firstsibling-»Prev-»NextSibling = NULL; /* Break links */ 
FirstSipling = FirstSibling->NextSibling: 

| 

TreeArray[ NumSiblings ] = NULL; 





/* Combine the subtrees two at a time, */ 
/* going ieft to right */ 
for( 1 = 0; i + 1 < NumSibtings: i += 2 2 
TreeArray[ i ] = CompareAndL ink 
TreeArray[ i ], TreeArray[ 3 + 1 ] 3; 
/* j has the result of the last CompareAndLink */ 
/* If an odd number of trees, get the last one +f 
= 了 一 5 
if( j == NumSiblings - 3 2 
TreeArray[ j ] = CompareAndLink( 
TreeArray[ į }, TreeArray[ j+ 2 l); 


/* Now go right to left, merging last tree with */ 
/* next to last. The result becomes the new last */ 
for( ; j >= 2; j -= 22 

TreeArray[ j - 2 1 = CompareAndlink( 
TreeArray[ j - 2 1}, TreeArray[ j 1 5; 


return TreeArrayl 0 j; 


图 12-51 Mr: AAIE 


这 种 方法 是 已 经 提出 的 许多 变形 方法 中 最 简单 和 最 实际 的 方法 ,我 们 称 之 为 两 趟 合并 法 
(two-pass merging)» 首先 ,我 们 从 左 到 右 扫 描 , 合 并 语 儿子 对 .= 在 第 一 次 扫描 之 后 ,我们 有 一 
半数 量 的 树 要 合并 。 RAT TS BAH, MERA. 在 每 一 步 ,我 们 将 第 一 次 扫描 剩 下 的 最 
右边 的 树 和 当前 合并 的 结果 合并 。 例如 ,如 果 有 8 个 儿子 cl 到 cg, 那么 第 一 次 扫描 进行 c 和 


——- ———————— 
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caca Fl cascs M cg cy 和 ca WAH. BERGE dida ds A das RINELLA H d 和 da fA 
行 第 二 未 打 摘 ,然后 da 和 这 个 结果 合并 .最 后 d, 再 利 刚 得 到 的 结果 台 并 。 

这 蛙 的 实现 方法 要 求 一 个 数组 存储 诸 子 树 。 在 最 坏 情 形 下 ,可 能 有 N- 1 项 部 是 根 的 儿 
子 , 因 此 这 个 数组 必然 很 大 . 

其 他 一 些 合并 方法 在 练习 中 讨论 。 惟 - :简单 的 而 用 容易 发 现 缺 从 的 合并 方法 是 从 左 到 石 
PRB AISA 12.35)。 配 对 堆 是 “简单 即 更 好 "的 一 个 很 好 的 例子 ,并 且 似 乎 二 要求 De- 
creaseKey 或 Merge 操作 的 一 些 重要 应 用 所 选择 的 方法 。 


总 结 


it =A 


企 这 --- 音 ,我 们 看 到 并 及 查找 树 儿 各 有效 的 变种 。 自 项 向 下 伸展 树 提 供 O Cog NOME TE 
能 ,treap 树 给 出 O(logN) 随 机 化 的 性 能 ,而 红 黑 树 .确定 性 跳跃 表 和 AA- 树 则 均 给 出 对 基本 操 
作 的 O(logN) 最 坏 情 形 性 能 。 在 各 种 结构 之 间 的 交换 涉及 代码 复杂 性 ,删除 的 简易 性 以 及 不 
癌 的 查找 和 播 人 的 开销 。 很 难说 哪 种 结构 是 明显 的 赢家 。 复 现 的 论题 包括 树 的 旋转 以 及 标 并 
节点 的 使 用 以 避免 对 NULL 指针 许多 信人 的 测试 , 若 不 标记 节点 则 这 些 测 试 原本 是 必 不 可 少 
的 ,， 即 使 理论 的 界 水 是 最 优 的 ,kd 树 还 是 给 出 了 执行 范围 查找 的 实际 方法 。 

最 后 ,我们 描述 配对 堆 并 将 配对 堆 编 程 , 它 似 平 是 最 实际 的 可 合并 的 优先 队列 ,特别 是 当 
需要 DecreaseKey 操作 的 时 候 。 不 过 ,经 验 的 结果 尚未 得 刘 解 析 方法 的 分 析 证 实 ， 


练习 


1 WEAR A Mm FRE seed B OClogN). 
212.2. 证 明 对 于 从 底 向 上 展开 存在 每 次 访问 需要 2logN 次 旋转 的 访问 序列 。 


12.3. 修改 伸展 树 以 支持 对 第 上 & 个 最 小 项 的 查询 。 在 确定 性 跳 牙 表 中 如 司 处 理 ? 

12.4 从 经 验 上 比较 简化 的 从 项 向 下 展开 和 原始 描述 的 从 项 同 下 展开 : 

12.5 编写 关于 红 黑 树 的 删除 过 程 。 

12.6 证明 红 黑 树 的 高 度 最 多 为 2logN ,并 证 明 这 个 界 实质 上 不 能 再 降低 。 

12.7 USA AVL 树 都 可 以 被 涂 成 红 黑 树 . 所 有 的 红 黑 树 都 是 AVL Rg? 

12.8 证 明 1-2-3 确定 性 跳跃 表 可 以 表示 成 2 3-4 树 , 它 的 项 在 内 部 节点 以 及 横 叶 上 。 
9 


如 果 我 们 试图 插 人 已 经 在 确定 性 跳跃 考 中 存在 的 项 ,那么 会 发 生 什么 情况 ? 

12.10 证 明 在 1-2-3 确定 性 跳跃 表 中 最 多 能 够 用 到 2N T 

.12.11 我 们 可 以 用 CC 语言 把 每 一 个 抽象 节点 表示 成 动态 分 配 的 前 向 指针 数组 以 代 奉 指针 
链表 。 指 出 如 何 用 这 种 方法 实现 1-2-3 确定 性 跳 牙 表 并 保持 每 个 操作 的 O ClogN ) 时 
EES 

12.12 EBXT 1223 ME EBRA HWRE 

12.13 证 明 AA- 树 中 关于 删除 的 算法 是 正确 的 。 

12.14 给 出 AA 树 的 一 种 非 递归 的 白 顶 向 下 实现 方法 。 将 其 与 课文 中 的 实现 方法 在 简单 性 
利 效率 方面 进行 比较 。 

12.15 递归 地 编写 出 Skew 过 程 和 Split 过 程 ,使 得 对 删除 操作 每 个 过 程 只 需 调 用 一 次 、 

1016 AA BHERIBEUE IRSE BB 树 少 多 少 行 9 这 能 使 AA- 树 更 快 吗 ? 

D.U ”通过 使 用 一 个 栈 来 非 递归 地 实现 reap 树 的 插 人 人 例 程 。 这 种 努力 值得 吗 ? 
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12.18 


«« 12.19 
12.20 
12.21 


12.27 


12.28 
12.29 


12.30 





一 一 ——- - —————- 
- -一 一 一 


通过 使 用 访问 次 数 作 为 优先 级 并 在 每 次 访问 后 党 要 时 执行 旋转 我 们 可 以 使 treap 树 
成 为 是 自 调 整 的 结构 。 将 这 种 方法 和 随机 北方 法 进行 比较 。 或 者 ,在 每 次 访问 一 项 
时 生成 一 个 随机 数 。 如 果 这 个 数 小 于 X MRT AEE ARACA X 的 新 
的 优先 级 (执行 相应 的 旋转 )。 

让 明 , 恕 困 把 项 排序 ,那么 如 使 优先 级 并 未 排序 ,treap 树 也 可 以 以 线性 时 间 构 造 ， 
不 用 NullNode 标记 实现 某 些 树 结 构 。 使 用 标记 可 以 节省 多 少 编程 工作 ” 

假设 对 于 每 个 节点 我 们 把 NULL 上 指针 的 个 数 存 储 在 它 的 子 树 中 , 称 之 为 节点 的 权 
Cweight}。 采 用 下 列 方 法 :如 果 左 子 树 和 厂子 树 的 权 相 差 趋 出 因子 2, 那么 彻 扶 重建 
根 在 该 节点 的 子 树 。 证 明 下 列 结论 : 

a. JA TEE ELA O(5) 重 建 一 个 节点 ,其 中 S 是 该 节点 的 权 。 

b. 该 算法 每 次 插 和 人 操作 的 挫 还 时 间 为 O(logN)。 

c. 我 们 能 够 以 O(Slog5) 时 间 在 kd 树 中 重建 一 个 节点 ,其 中 S 是 该 节点 的 权 . 

d. 我 们 可 以 将 该 算法 用 于 kd 树 ,其 每 次 插 人 的 代价 为 O(logN). 

假设 我 们 对 任意 一 棵 2-d 树 调用 SingleRotateWithLeft。 详 细 解 释 其 结果 不 有 是 一 
棵 可 用 的 2-d 树 的 全 部 原因 。 

实现 对 于 有 do WEGA MAHAA. 不 要 使 用 递归 . 

对 于 对 应 于 久 =3,4,5 的 PP 的 值 ,确定 部 分 匹配 查询 的 时 间 。 

对 于 一 棵 理想 平衡 &a 树 , 求 出 课文 中 引用 的 一 次 范围 查询 (参见 12.6 市 ) 的 最 坏 全 
形 运行 时 间 。 

2.d HE(2Q-d heap) 是 允许 每 一 项 拥有 阿 个 单个 关键 字 的 一 种 数据 结构 。DeleteMin $ 
作 可 以 对 于 这 两 个 关键 字 中 的 任 一 个 执行 。2-d 堆 是 共有 下 述 性 质 的 充 全 一 又 怪 : 
对 于 偶数 深度 上 的 任 一 节点 和 ,存储 在 X 上 的 项 具有 它 的 子 树 上 最 小 的 下 1 关键 
= .而 对 于 奇数 深度 上 的 任 -节点 X FE X 上 的 项 具有 它 的 子 树 上 最 小 的 二 2 
关键 字 。 

a. 画 出 美 于 (1.10),(2,9),(3,8),(4,7),(5,6) 诸 项 的 一 个 可 能 的 2-d HE. 

. 如 柯 找 出 具有 最 小 # ] 关键 子 的 项 ? 

.如何 找 出 具有 最 小 # 2 关键 字 的 项 ? 

EB -个 将 一 新 的 项 插 人 到 2-4 堆 中 的 算法 ， 

, 给 出 一 个 对 于 任 一 关键 字 执行 DeleteMin 操作 的 算法 。 

. 给 出 一 个 以 线性 时 则 实施 FixHeap 的 算法 。 

将 前 面 的 练习 推广 以 得 出 一 个 kd 堆 , 在 这 个 堆 中 每 一 项 都 可 有 k PET RES S 
你 应 该 能 够 得 到 下 列 的 界 : 以 O(logN) 实 施 Insert, LA O(logN) KHE DeleteMin, A 
及 以 OCEN) 执 行 FixHeap. 

ER e-d 堆 可 以 用 于 实现 双 端 优先 队 州 。 

抽象 地 推广 kd 堆 使 得 只 有 都 些 根据 关键 字 1 分 支 的 层 有 两 个 儿子 (所 有 其 他 层 必 
有 一 个 儿子 )。 

a. 我 们 需要 指针 吗 ? 

b. 显然 ,那些 基本 算法 仍然 有 效 , 它 们 的 新 的 时 间 界 是 多 少 ? 

使 用 kad 树 实 现 DeleteMin。 对 于 随机 树 , 你 期 望 其 平均 运行 时 间 是 多 少 ? 
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12.31 (FA kd EEEIEE 3.26), AATRE FF DeleteMin. 
12.32 重用 一 个 NullNode 标记 实现 配对 堆 ， 
ax 12.33 TEAR SPR PROB HEE ,每 次 操作 的 挫 还 时 间 为 O(logN). 

12.34 CombineSiblings 的 另 一 种 方法 是 把 所 有 的 兄弟 部 放 到 一 个 队列 中 ,并 反复 Dequeue 
及 合并 队列 中 的 前 两 项 JAA A SBR APE. 

12.35 在 前 面 的 练习 中 不 用 队列 而 使 用 栈 是 个 坏 主 意 , 通 过 给 种 一 个 序列 导致 每 次 操作 人 花 
£t 人 NI) 来 妥 以 说 明 。 这 就 是 从 左 到 右 单 畏 全 并。 

12.36 不 用 DecreaseKey 我 们 可 以 除去 父 指 针 。 使 用 斜 堆 结果 会 如 们 ? 
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k-d(k-d 8,144, 485-488 


leftchild/rightsibling implementationt 在 儿子 “在 兄弟 


THA), 209 

Tfumum spanning Ez] ^E p BY) 313-319, 418 
red-black( ZT SERI ), 146, 457-469 
splay tree{ ffi ftf ) , 123-132, 445-449, 453-461 
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Vulemimn, J., 218,452,499 


Wagner, R.A. .426 
Wagrnan, M. N.,175 
Weht-balanced treet BE E ffr 2,497 408 
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